 Florin Sava Psihologia validată ştiinţific Editura POLIROM  © by Editura POLIROM www polirom ro Editura POLIROM Iaşi, B-dul Carol I nr ; P O BOX , Bucureşti, Splaiul Unirii nr , bl B A, sc , et ; sector , , O P , C P - ISBN ePub: - - - - ISBN PDF: - - - - ISBN print: - - - - Coperta: Laurenţiu Midvichi Pe copertă: © Spectral-Design/Shutterstock com Această carte în format digital (e-book) este protejată prin copyright şi este destinată exclusiv utilizării ei în scop privat pe dispozitivul de citire pe care a fost descărcată Orice altă utilizare, incluzând împrumutul sau schimbul, reproducerea integrală sau parţială, multiplicarea, închirierea, punerea la dispoziţia publică, inclusiv prin internet sau prin reţele de calculatoare, stocarea permanentă sau temporară pe dispozitive sau sisteme cu posibilitatea recuperării informaţiei, altele decât cele pe care a fost descărcată, revânzarea sau comercializarea sub orice formă, precum şi alte fapte similare săvârşite fără permisiunea scrisă a deţinătorului copyrightului reprezintă o încălcare a legislaţiei cu privire la protecţia proprietăţii intelectuale şi se pedepsesc penal şi/sau civil în conformitate cu legile în vigoare Lectura eco - un supererou al lumii moderne! Versiune digitală realizată în colaborare cu Libris ro  FLORIN A SAVA este reprezentantul domeniilor Psihologie şi Psihoterapie în cadrul Comisiei de Ştiinţe Sociale a Consiliului Naţional al Cercetării Ştiinţifice, directorul departamentului de Psihologie din cadrul Universităţii de Vest din Timişoara şi coordonatorul Laboratorului de Cogniţii Sociale şi Evaluare a Personalităţii (http://socpers psihologietm ro) Printre preocupările sale ştiinţifice se regăsesc evaluarea personalităţii şi a inteligenţei, precum şi măsurătorile şi intervenţiile implicite validate ştiinţific Interesul pentru cercetare a fost completat, în plan naţional, cu activitatea de diseminare a cunoştinţelor din domeniul metodologiei cercetării şi al analizei datelor De acelaşi autor: Analiza datelor în cercetarea psihologică ( , ), Metode implicite de investigare a personalităţii (coord , Polirom, ) Familiei mele, Laura, Rareş şi Sonia, pentru felul lor molipsitor de a se bucura în fiecare zi Prefaţă În domeniul psihologiei din România se publică foarte multe cărţi Puţine sunt însă cele care contează cu adevărat, devenind repere la nivel naţional Aceasta este o carte care contează şi care cred că va deveni un reper pentru psihologia românească Şcoala clujeană de psihologie este cea care a promovat în psihologia din ţară, în mod explicit şi programatic, metoda ştiinţifică experimentală Într-adevăr, primul Institut de Psihologie Experimentală din România a fost înfiinţat în la Cluj de către profesorul Florian Ştefănescu-Goangă, fost student al lui Wilhelm Wundt, care este considerat la nivel internaţional fondatorul psihologiei Autorul acestei lucrări, conferenţiarul Florin Alin Sava, este, prin studiile la nivel de licenţă şi masterat, un produs al şcolii de psihologie din Timişoara, iar prin studiile la nivel de doctorat şi postdoctorat, un produs al şcolii clujene de psihologie Aşadar, substratul experimental şi ştiinţific riguros este fundamentul activităţilor academice şi de cercetare performante ale colegului Florin Alin Sava Şcoala clujeană de psihologie a generat după revoluţia din (nu mai pomenesc aici lucrările monumentale dinainte de revoluţie) o serie de publicaţii fundamentale pentru psihologia experimentală din România Astfel, fundamentele iniţiale au fost puse de o lucrare coordonată de profesorul Ioan Radu (Radu şi colab , , Metodologie psihologică şi analiza datelor, Sincron, Cluj-Napoca) Ulterior, Florin Alin Sava publică o lucrare care completează excelent lucrarea profesorului Radu, aducând în atenţia cititorului metode şi tehnici noi şi/sau detaliind critic metodele tradiţionale (Sava, / , Analiza datelor în cercetarea psihologică Metode statistice complementare, ASCR, Cluj-Napoca) Am extins apoi aceste fundamente experimentale în domeniul clinic (David, , Metodologia cercetării clinice Fundamente, Polirom, Iaşi) Prin lucrarea de faţă, Florin Alin Sava completează excelent lucrările menţionate anterior prin extinderea metodologiei cercetării psihologice în contextul practicii psihologice validate ştiinţific (evidence-based practice), cu accent, fără a fi exclusiv, pe domeniul clinic Lucrarea colegului Florin Alin Sava este una complexă, foarte bine gândită şi structurată, acoperind aspecte teoretice (de exemplu, problematica pseudoştiinţei), metodologice (de exemplu, metaanaliza, studiul clinic controlat) şi practice (de exemplu, raportarea rezultatelor în articole), foarte importante pentru psihologia modernă Sigur, nu este o lucrare uşor de parcurs şi înţeles – fiind totuşi o lucrare ştiinţifică care abordează aspecte dificile –, dar este uşor de citit, fiind bine scrisă În plus, lucrarea provoacă şi stimulează, devenind treptat un manual personal de know-how, la care ne putem raporta mereu în cercetări şi/sau publicarea articolelor ştiinţifice Aşa cum am afirmat anterior, cred sincer că această lucrare va deveni un reper în familia lucrărilor de metodologia cercetării în psihologie publicate în ţară, fiind necesară şi utilă unui public divers De aceea o recomand cu toată încrederea nu doar studenţilor, ci oricărui cercetător serios din psihologie, în particular, şi din ştiinţele socioumane, în general Prof univ dr Daniel David Universitatea „Babeş-Bolyai”, Cluj-Napoca, România (profesor) Mount Sinai School of Medicine, New York, SUA (profesor asociat) Cuvânt înainte Pentru cei mai mulţi dintre cei care ajung să răsfoiască sau să citească acest volum, psihologia reprezintă un domeniu fascinant şi complex, ce oferă o perspectivă aparte asupra realităţii înconjurătoare şi care, de ce nu, reprezintă un mijloc de trai prezent sau viitor În interiorul psihologiei avem libertatea de a alege anumite perspective teoretice cărora le devenim loiali, în care credem şi pe care ajungem, la rândul nostru, să le promovăm către ceilalţi, fie aflaţi în interiorul breslei (studenţi, practicieni sau oameni din sfera academică), fie din afara ei (pasionaţii de psihologie şi beneficiarii serviciilor psihologice) Îndrăgim aceste modele şi explicaţii psihologice pentru că ni se potrivesc, pentru că rezonăm afectiv cu ele şi ajungem să le îmbrăţişăm, fără a căuta dovezi solide sau raţionamente logice, atent construite, pentru a le accepta Sloganul sub care se desfăşoară întreg acest scenariu este presărat cu intenţii bune, consumatorii de psihologie fiind invitaţi să îşi aleagă abordarea care li se potriveşte, pentru că este suficient loc pentru toate perspectivele teoretice în psihologie Şi, într-adevăr, această diversitate productivă a permis psihologiei să evolueze şi să îşi extindă influenţa dincolo de graniţele sale clasice, dincolo de disputele tradiţionale dintre psihanaliză, behaviorism, abordarea umanistă sau cognitivism Astăzi, din ce în ce mai mulţi psihologi lucrează în neuroştiinţele cognitive – pentru a stabili legătura dintre procesele cognitive şi creier; în genetică – pentru a stabili legătura dintre anumite structuri genetice şi comportament; în medicină – pentru a stabili legătura dintre anumite constructe psihologice şi riscul îmbolnăvirii etc Psihologia şi-a extins influenţa nu doar în zona ştiinţifică, ci şi în aceea a spiritualităţii De exemplu, întreg domeniul New Age este saturat în explicaţii de natură psihologică Parafrazând o expresie comună, aş spune că sub umbrela psihologiei a fost loc pentru toată lumea Filosofia acestei cărţi pune la îndoială o asemenea perspectivă liberală Lucrarea este înrădăcinată în perspectiva abordării validate ştiinţific (evidence-based approach), iniţiată în interiorul ştiinţelor medicale Această perspectivă este una ateoretică, prin urmare nu veţi găsi alte paradigme de explicare a comportamentului uman decât cele deja consacrate Ceea ce face abordarea validată ştiinţific este să analizeze critic modelele teoretice existente în psihologie, utilizând aparatul ştiinţific În termenii unei analogii, dacă presa este câinele de pază al democraţiei, am putea spune că abordarea validată ştiinţific este gardianul oricărei ştiinţe empirice În absenţa vocii (perspectivei) abordării validate ştiinţific, psihologia este ameninţată să fie parazitată de abordări pseudoştiinţifice dăunătoare nu numai pentru ea ca ştiinţă, ci şi pentru beneficiarii serviciilor psihologice În primele două capitole ale cărţii vom insista asupra educării publicului pentru a diferenţia între ştiinţă şi pseudoştiinţă în psihologie şi asupra prezentării premiselor şi paşilor de lucru în practica psihologică, astfel încât serviciile psihologice oferite să fie unele validate ştiinţific Astfel, la fel ca în alte ştiinţe preocupate de optimizarea comportamentului uman şi de rezolvarea unor probleme care pot afecta sănătatea şi calitatea vieţii unui individ, şi în psihologie avem nevoie: (a) să ştim că intervenţia oferită pentru problema constatată este una eficientă (în urma unui demers ştiinţific); (b) să ştim de ce intervenţia oferită este una eficientă, pentru a-i potenţa efectul şi pentru a cunoaşte mai bine mecanismele psihologice implicate (în urma unui demers ştiinţific); (c) să ştim, din respect pentru clienţii noştri, dar şi din constrângeri bugetare, că soluţia aleasă pentru problema lor are cel mai bun raport cost-eficienţă (desigur, tot printr-un demers ştiinţific) Abordarea validată ştiinţific are în vedere toate cele trei puncte menţionate, dar mai cu seamă pe primele două Celelalte şase capitole sunt rezervate subiectului principal al lucrării de faţă, adică descrierii demersului de cercetare necesar pentru a afirma despre un serviciu psihologic oferit că este unul validat ştiinţific (adică un serviciu eficient, fundamentat pe un model teoretic valid şi cu un bun raport cost-eficienţă) Astfel, capitolul , unul dintre cele mai importante capitole ale lucrării, prezintă o grilă de lectură a studiilor empirice din psihologie, prin componentele critice necesare realizării şi/sau evaluării unui demers de cercetare În cadrul capitolului am subliniat în numeroase rânduri importanţa dinamicii dintre obiectivele cercetării (ceea ce-şi propune studiul) şi validitatea cercetării (metodologia şi mijloacele de analiză a datelor utilizate pentru a răspunde adecvat la obiectivul studiului) Demersul ştiinţific este, apoi, detaliat în patru capitole succesive ( - ), fiecare prezentând tipurile principale de studii întâlnite: cele experimentale şi cvasiexperimentale (capitolul ), cele non-experimentale (capitolul ), studiile de tip cost-eficienţă (capitolul ) şi cele metaanalitice (capitolul ) Lucrarea se încheie cu un capitol destinat redactării articolelor ştiinţifice (capitolul ), scris din dorinţa de a ajuta studenţii, masteranzii şi doctoranzii să înţeleagă standardele de publicare din domeniul psihologiei, să-şi întărească simţul critic atunci când lecturează rezultatele unor studii şi, de ce nu, să-i ajute să scrie mai bine lucrările ştiinţifice pe care le au de redactat Toate aceste cinci capitole sunt scrise într-o manieră practică, oferind cititorilor o serie de sugestii şi recomandări despre cum să deruleze astfel de studii şi cum să reflecteze critic asupra rezultatelor obţinute, constituind, astfel, un veritabil manual de metodologie a cercetării Utilitatea conţinuturilor prezentate depăşeşte cadrul discuţiei despre psihologia validată ştiinţific, informaţiile fiind relevante pentru a înţelege demersul de cercetare din întreaga zonă a ştiinţelor comportamentale Prin complexitatea unor analize prezentate, lucrarea răspunde mai bine nevoilor specialiştilor în psihologie decât amatorilor de psihologie Specialiştii în psihologie vor găsi în acest volum acele informaţii care să-i ajute să facă pasul de la textele introductive de metodologia cercetării la cerinţele necesare pentru a analiza critic rezultatele studiilor lecturate şi de a efectua cercetări competitive la nivel internaţional Amatorii de psihologie vor înţelege mai bine eforturile psihologiei ca ştiinţă, astfel încât să ajungă să distingă între serviciile psihologice bine fundamentate şi abordările ezoterice Acest lucru îi va ajuta să devină consumatori inteligenţi de psihologie şi să preţuiască actul psihologic fundamentat ştiinţific În final, aş dori să mulţumesc celor care au contribuit la efortul de a duce la bun sfârşit acest proiect Aş începe cu cei care au fost primii mei cititori şi care m-au ajutat să calibrez complexitatea conţinuturilor prezentate spre beneficiul masteranzilor şi al doctoranzilor Este vorba de Otilia Matei (masterandă) şi de colaboratorii mei cei mai apropiaţi, doctoranzii Andrei Rusu şi Silvia Rusu Apoi i-aş aminti pe Dr Laurenţiu Maricuţoiu şi Dr Sebastian Pintea, a căror consultanţă tehnică oferită a fost extrem de folositoare Nu în ultimul rând, îi mulţumesc profesorului universitar clujean Daniel David pentru feedbackul său consistent şi pertinent legat de conţinutul unor capitole, dar mai ales pentru efortul susţinut pe care-l depune în promovarea psihologiei validate ştiinţific ca reper prescriptiv în activitatea oricărui psiholog Este un deziderat în care cred şi în folosul căruia sper să contribuie această carte, prin impactul ei în comunitatea psihologilor din România Am lăsat la final mulţumirile pentru cei alături de care încep mereu o nouă zi, Sonia, Rareş şi Laura Le mulţumesc pentru suportul afectiv şi pentru momentele de inspiraţie prilejuite Florin A Sava Timişoara, Partea întâi Fundamentele cercetării ştiinţifice în psihologie Capitolul Abordarea ştiinţifică vs pseudoştiinţifică în psihologie Expansiunea psihologiei în societate Îndeosebi după cel de-al Doilea Război Mondial, psihologia a devenit un domeniu ştiinţific şi aplicativ aflat într-o creştere exponenţială, ce continuă inclusiv în prezent O statistică realizată de Sexton şi Hogan reprezentativă pentru SUA ( apud Louw, ) plasează psihologia pe locul trei, ca ritm de creştere a numărului de studenţi, după informatică şi matematică Această situaţie nu este însă una izolată, ea fiind prezentă în foarte multe ţări europene, precum şi în statele cu o economie bine dezvoltată cum ar fi Australia, Canada etc Bunăoară, numai în Australia, contribuţia serviciilor psihologice la produsul intern brut a crescut în zece ani cu % faţă de , iar numărul studenţilor care urmează studii de master sau doctorat din domeniul psihologiei aproape s-a dublat în aceeaşi perioadă (Patrick, ) Aceeaşi situaţie, ce reflectă un interes deosebit pentru psihologie, se regăseşte şi în societatea românească De pildă, datele de mai jos descriu o situaţie particulară, cea a admiterii la Universitatea de Vest din Timişoara: în sesiunea din iulie , psihologia a ocupat locul ca număr de studenţi înscrişi în anul I, după ştiinţele economice şi drept Serviciile psihologice nu au crescut însă numai cantitativ, ci s-au şi diversificat, dezvoltând noi nişe de piaţă din perspectiva serviciilor psihologice oferite (Goodheart, ) Cu toate că majoritatea serviciilor de psihologie se regăsesc în sfera psihologiei clinice şi a consilierii psihologice ( % dintre psihologii din întreaga lume fiind psihologi clinicieni sau consilieri psihologici – vezi Sexton şi Hogan, apud Louw, ), în ultima vreme asistăm la o creştere a serviciilor psihologice în arii din ce în ce mai variate, precum domeniile industriei şi afacerilor, juridic, militar, sportiv, în publicitate şi politică etc O posibilă explicaţie, de sorginte filosofică, pentru expansiunea psihologiei constă în nivelul ridicat de insecuritate pe care îl resimte o persoană în încercarea sa de a se adapta la provocările lumii contemporane (Savage, ), psihologia fiind domeniul care oferă indivizilor afectaţi de aceste provocări, modalităţi adecvate de coping, potrivite unei societăţi de tip secularizat O altă explicaţie de tip filosofic pune expansiunea psihologiei pe seama apariţiei societăţii capitaliste postindustriale de tip occidental, care se caracterizează printr-un sistem liberal avansat, ce conferă cetăţenilor săi o serie de drepturi şi libertăţi Valori precum individualismul sau libertatea de a decide ocupă un rol principal în discursul public, iar grija primordială a guvernanţilor este de a oferi cât mai multor indivizi o viaţă în care sănătatea, fericirea şi bunăstarea personală sunt scopuri de atins (Jansz, , Louw, ) Din acest punct de vedere, psihologia este domeniul ştiinţific care poate contribui eficient la bunăstarea individuală Discursurile din mass-media despre nevoile individuale ale fiecăruia şi despre dreptul fiecăruia dintre noi de a-şi satisface aceste nevoi („pentru că merit!”), dublate de industria de tip self-help care a dobândit un caracter de masă („pentru a evolua emoţional şi spiritual!”) au condus la dezvoltarea abordării de tip psihologic în societatea contemporană Această explozie în mass-media, dublată de preocuparea cinematografiei de pretutindeni pentru ecranizarea unor scenarii cu încărcătură psihologică, au contribuit la constituirea unei societăţii psihologizate (Jansz, ), fapt ce i-a determinat pe unii autori precum Gross ( , p apud Louw, ) să afirme: „Astăzi, psihologia este artă, ştiinţă, terapie, religie, cod moral, stil de viaţă, filosofie şi cult miezul societăţii contemporane” În sfârşit, o a treia explicaţie posibilă pentru expansiunea psihologiei ca ştiinţă, îşi are originea în modificarea implicării statului în menţinerea şi promovarea sănătăţii cetăţenilor săi, prin reconceptualizarea modului în care se face asistenţa socială şi asistenţa medicală acordată populaţiei Acest lucru a condus nu numai la dezvoltarea serviciilor de psihologie clinică şi consiliere psihologică, ci şi la pătrunderea cunoştinţelor de psihologie în pregătirea profesională a altor ocupaţii din sfera asistenţei medicale şi sociale Pe lângă beneficiile aduse de includerea serviciilor psihologice în practica asistenţei medicale/sociale, care au condus la creşterea cererii de servicii psihologice pe piaţă, această practică a condus, adeseori, la percepţia greşită din partea oamenilor de rând că psihologia se ocupă doar de oameni aflaţi în situaţii de suferinţă emoţională ca urmare a instalării unor tulburări psihopatologice sau a problemelor familiale/profesionale ce necesită consiliere (Levant, ) Costurile expansiunii sociale asupra psihologiei ca ştiinţă Beneficiile expansiunii psihologiei în societatea actuală sunt însoţite, însă, de o serie de costuri pe care psihologia, ca domeniu ştiinţific le plăteşte adesea Pe scurt ele s-ar putea încadra în patru mari categorii: (a) superficialitatea discursului psihologic public; (b) distorsionarea conţinutului public referitor la psihologie; (c) asocierea în mod eronat a psihologiei cu spiritualitatea; (d) dezvoltarea unei industrii alternative bazată pe pseudoştiinţe Superficialitatea discursului psihologic public Într-o bună măsură, publicul a prins gustul discuţiilor şi interpretărilor cu iz psihologic În cercurile de intelectuali şi filosofi, cât şi în domeniul ştiinţelor umaniste, influenţa lui Freud şi a constructelor psihanalitice a devenit una relevantă pentru evoluţia domeniului Publicul larg, prin intermediul emisiunilor TV sau a articolelor din presă, a incorporat în vocabularul său expresii de genul „criză de identitate”, „reprimarea nevoilor”, „dezvoltare personală”, „stimă de sine” etc Dezbaterile de acest gen au dezvoltat publicului senzaţia că în psihologie, ca în politică, oricine îşi poate exprima o părere competentă, că discursul psihologic este unul facil, de bun-simţ Din nefericire, la această impresie au contribuit inclusiv specialiştii prezenţi în mass-media, psihologi sau psihoterapeuţi cu notorietate, dar fără contribuţii ştiinţifice relevante în domeniu În interpretarea diferitelor evenimente, ei apelează frecvent, fie la explicaţii tipice simţului comun, lipsite de specificitatea unei adevărate relaţii de tip cauză-efect (de exemplu, „problemele adolescenţilor provin aproape întotdeauna din criza lor de identitate şi din conflictul existent între generaţii”), fie, mai grav, promovează o serie de credinţe populare, dar false din punct de vedere ştiinţific (de exemplu, „majoritatea oamenilor folosesc doar % din capacitatea creierului”) Pentru o listă de mituri (credinţe populare) fără fundamentare ştiinţifică puteţi consulta traducerea lucrării lui Lilienfeld, Lynn, Ruscio şi Beyerstein ( ) Distorsionarea conţinutului public referitor la psihologie În prefaţa aceleiaşi lucrări (Lilienfeld et al , , pp - ) se afirma că „psihologia este peste tot în jurul nostru în fiecare zi, ştirile, programele de televiziune, filmele şi internetul ne bombardează cu tot felul de presupoziţii în ceea ce priveşte o mulţime de subiecte psihologice în lumea grăbită a supraîncărcării informaţionale, dezinformarea referitoare la psihologie este cel puţin la fel de răspândită ca informaţia corectă” Acest lucru poate fi observat direct la o parte însemnată dintre studenţii anului I, ciclul licenţă, care au aşteptări nerealiste despre ce vor învăţa la specializarea psihologie În mentalul lor se regăsesc mai degrabă topici apropiate de ideea senzaţionalului (de exemplu, tulburările mentale şi abuzul sexual asupra copiilor) sau topici legate de domeniul parapsihologiei (de exemplu, experienţele în afara corpului, visele premonitorii etc ), decât topici specifice unei abordări ştiinţifice a psihologiei precum neuropsihologia sau învăţarea bazată pe condiţionare operantă Distorsionarea conţinutului public al psihologiei are loc şi la un alt nivel, cel al diferenţelor între agenda publică (psihologia populară) şi agenda psihologiei ştiinţifice În acest sens, Stanovich ( ) remarca foarte bine că există o discrepanţă majoră între temele de interes public de sorginte psihologică şi temele actuale din cercetarea psihologică De pildă, pentru public, cele mai cunoscute teorii psihologice sunt cele dezvoltate de Freud şi de susţinătorii săi Acestea constituie cel mai adesea reprezentarea în mentalul colectiv a domeniului psihologiei În abordarea ştiinţifică, însă, conceptele lui Freud constituie adesea informaţii complementare prezentate în orice manual introductiv de psihologie, reprezentând doar - % din conţinutul psihologic prezentat Mai mult, cel mai adesea aceste informaţii sunt prezentate într-un context critic, subliniind limitele teoriei psihanalitice Asocierea eronată a psihologiei cu spiritualitatea Poate e greu de crezut, dar cu aproximativ de ani în urmă prestigioasa universitate britanică Cambridge a refuzat înfiinţarea unui laborator de psihofizică deoarece acesta ar „insulta religia, prin faptul de a măsura sufletul omului prin intermediul unui set de scale” (Hearst, apud Stanovich, , p ) Această tendinţă de a intersecta (asocia) psihologia cu problemele de spiritualitate a rămas constantă în timp, iar în urma secularizării societăţii actuale şi a dezvoltării unor direcţii de studiu precum psihologia transpersonală sau psihologia umanistă s-a obţinut chiar un discurs ce îmbină concepte psihologice şi spirituale, atractiv pentru o bună parte a publicului Acest lucru este valabil îndeosebi pentru adepţii unei viziuni holiste (Kendler, ), care au tendinţa de a căuta explicaţii de sorginte spirituală despre funcţionarea organismului uman, tinzând să caute mereu o explicaţie de genul „întregul este mai mult decât suma părţilor” şi să folosească eventualele dovezi ştiinţifice colaterale drept punct central de sprijin al ipotezei lor că există ceva dincolo de lumea materială Amalgamul de dovezi ştiinţifice, de filosofie şi de idei religioase (spirituale) poate fi extrem de atrăgător pentru aceste persoane aflate în căutarea fericirii şi confortului spiritual, dar dăunător pentru psihologie ca domeniu ştiinţific Această stare de fapt a condus la o explozie a literaturii de tip self-help, cele mai multe dintre aceste cărţi sunt făcute să se vândă, nu să ajute, fiind arareori fundamentate ştiinţific (Kaminer, ) Aceeaşi preocupare pentru spiritualitate a condus la integrarea unor metode şi tehnici psihologice într-un domeniu mai larg, cel al medicinei alternative Proliferarea unei industrii alternative bazată pe metode pseudoştiinţifice Înclinaţia minţii umane spre a accepta drept valide anumite credinţe nefundamentate ştiinţific este extrem de ridicată În SUA există de de ori mai mulţi astrologi decât astronomi, iar % dintre adulţii americani cred în posibilitatea de a comunica cu cei decedaţi, în vindecarea prin credinţă sau în astrologie (Lilienfeld, Lohr şi Morier, ) Situaţia este similară şi în alte părţi, inclusiv în România, unde un sondaj recent a reflectat că % dintre români cred că astrologia le influenţează viaţă, iar aproape % (sic!) cred în continuare că Soarele se învârte în jurul Pământului, în timp ce o treime sunt absolut convinşi că există oameni posedaţi de diavol (Vlăsceanu, Duşa şi Rughiniş, ) Un episod elocvent, de notorietate, întâlnit la noi este cel din campania prezidenţială de la finalul anului , când unul dintre candidaţi l-a acuzat pe celălalt că utilizează proprietăţile „flăcării violete” pentru a fi protejat energetic, demers prezentat pe larg în mass-media, dar sancţionat prin intermediul unei scrisori deschise cu iz pamfletar (David, ) Proliferarea pseudoştiinţelor pe un asemenea tărâm mental devine una evidentă, iar psihologia, ca domeniu ştiinţific a fost, la rândul său, afectată Trebuie precizat de la început că pseudoştiinţa nu este determinată de obiectul studiat, ci de modul de raportare la metodele ştiinţifice (Lilienfeld, Lynn şi Lohr, ) Prin pseudoştiinţă (însemnând ştiinţa falsă) se înţelege un demers aparent ştiinţific, dar care îşi apără descoperirile deviind de la metodele ştiinţifice, mai ales atunci când rezultatele empirice obţinute neagă concluziile pe care le susţin În termeni plastici, pseudoştiinţele joacă rolul unor impostori, pretinzând că joacă după regulile ştiinţei, pe care totuşi nu le respectă În urma acestei abordări, oamenii cu un nivel mai scăzut de pregătire în cultura şi metodologia ştiinţifică pot ajunge să considere asemenea demersuri ca fiind valide, deşi nu este cazul (Lilienfeld şi Landfield, ) Pseudoştiinţele pot lua atât forme grosiere de manifestare (cum ar fi cazul frenologiei), cât şi forme subtile, adesea sub forma unor tehnici variate de intervenţie în vederea optimizării comportamentului uman (neuroprogramarea lingvistică, terapia strigătului primar, tehnicile de autosugestie prin mesaje subliminale etc ) Descriptori specifici ai pseudoştiinţelor Distincţia dintre ştiinţe şi pseudoştiinţe se poate face pe seama unor indicatori Cu cât o abordare particulară are mai multe caracteristici specifice pseudoştiinţei, cu atât mai uşor este de diferenţiat această abordare în sfera pseudoştiinţelor Cu cât o abordare specifică are mai puţine caracteristici specifice pseudoştiinţei, cu atât este mai dificil de diferenţiat în privinţa acelei abordări dacă este o abordare ştiinţifică sau pseudoştiinţifică (Lilienfeld et al , ; Stanovich, ) Aceşti indicatori ar putea fi grupaţi în indicatori ai metodei (ce vizează preponderent aspecte ale metodologiei ştiinţifice, greu de decelat de publicul necunoscător), respectiv indicatori de stil (ce vizează preponderent aspecte ideologice, mai uşor de decelat de către public, chiar fără cunoştinţe avansate de metodologia cercetării)  Figura Indicatori specifici ai pseudoştiinţelor Pentru a înţelege mai bine semnificaţia celor indicatori amintiţi mai sus, vom descrie succint ce semnifică fiecare dintre ei Absenţa procesului de falsificabilitate Conform lui Popper ( / ), la baza diferenţei dintre ştiinţă şi abordările neştiinţifice se află încercarea omului de ştiinţă de a strânge date empirice care să-i invalideze ipotezele avute Demersul său este, aşadar, unul indirect, asemenea procesului de testare a ipotezelor, în care rezultatele nu se contorizează în termeni precum „ipoteza cercetării se confirmă”, ci în aceia că „ipoteza nulă este respinsă, sprijinind astfel ipoteza cercetării” Niciodată o teorie nu poate fi confirmată, ci doar sprijinită de datele empirice Pentru ca o teorie sau o abordare anume să poată fi falsificabilă este necesar (Stanovich, ): (a) să existe instrumente care să permită investigaţia ştiinţifică (de exemplu, expresia „Dumnezeu este creatorul universului” poate fi adevărată sau falsă, dar atât timp cât metodele ştiinţifice actuale nu permit verificarea afirmaţiei, nu se poate oferi un răspuns ştiinţific acceptabil deoarece lipsesc instrumente ştiinţifice care să permită testarea ei; (b) să fie suficient de specifică, încât să permită falsificabilitatea enunţurilor formulate (o teorie care poate explica orice sau care este prea vagă în formulare nu este considerată ca fiind ştiinţifică, deoarece nu se supune acestui criteriu al falsificabilităţii) De pildă, una dintre criticile aduse psihanalizei este aceea, că deşi teoria nu are capacitate predictivă specifică, cu alte cuvinte nu reuşeşte să anticipeze evoluţia unor comportamente, ea încearcă să explice orice post factum Însă această capacitate explicativă post factum (de exemplu, „autismul este o expresie a unei comunicări deficitare, reci, dintre mamă-copil, a unui deficit de afecţiune resimţit de către copil ca venind din partea mamei”, o teorie psihanalitică populară în secolul XX, dar nesusţinută ştiinţific de date) poate face mai mult rău şi chiar stigmatiza anumite categorii de oameni De aceea, o teorie ştiinţifică bună nu este una care încearcă să explice orice, într-o manieră raţionalizatoare, post factum, ci una care face predicţii specifice, anticipă evoluţia unor comportamente, iar aceste predicţii sunt susţinute de datele empirice colectate Caseta Exemplu ipotetic de teorie pseudoştiinţifică Un cercetător formulează teoria transferului comportamentului agresiv părinte-copil prin intermediul mecanismului inconştient de identificare cu agresorul Conform acestei teorii, copiii preiau (învaţă) de la părinţii lor modul agresiv de a răspunde la situaţii frustrante, deoarece au observat că un asemenea comportament poate aduce beneficii autorilor actului agresiv (de exemplu, obţin ceea ce îşi doresc) Acest transfer se realizează într-o manieră inconştientă, în cele mai multe situaţii, cu excepţia cazului în care acest proces inconştient este blocat de un mecanism pulsional declanşat de instinctul de afiliere al copilului, care inhibă orice manifestare de tip agresiv orientată către semeni Acest gen de teorie poate explica post factum orice tip de scenariu, prin urmare nu permite testarea falsificabilităţii afirmaţiilor Dacă copilul nu se comportă agresiv, explicaţia este că instinctul de afiliere a blocat transferul agresivităţii Dacă copilul se comportă agresiv, explicaţia este o mărturie a transferului inconştient de identificare cu agresorul Cu alte cuvinte, teoria poate fi utilizată pentru a explica orice, o caracteristică atractivă pentru consumatorii de psihologie cotidiană (pop), ce caută semnificaţii pentru originea comportamentului social, dar ineficientă din punct de vedere ştiinţific Apoi, chiar dacă această teorie ar fi permis verificarea unor predicţii specifice (precum corelaţia dintre nivelul agresivităţii dintre părinţi şi copii), ar fi fost nevoie de mai multe dovezi care să sprijine specificitatea mecanismelor cauzale enunţate în teorie, precum transferul inconştient al comportamentului agresiv prin declanşarea mecanismului de apărare – identificarea cu agresorul; existenţa unui blocaj pulsional (sic!) determinat de constructul de tip umbrelă – instinctul de afiliere etc Inversarea demersului de validare ştiinţifică În mod firesc îi revine cercetătorului care propune un anumit model sau o teorie să strângă dovezi în favoarea concepţiei sale În cazul curentelor pseudoştiinţifice, acest aspect este inversat, solicitându-li-se scepticilor să ofere dovezi împotriva aserţiunilor făcute în teoria sau modelul respectiv Mai concret, de exemplu, nu este datoria celor care contestă aserţiunea „efectele psihologice pozitive induse de practicarea meditaţiei sunt cauzate de accesarea conştiinţei universale” să demonstreze scepticismul lor prin dovezi Nici lipsa dovezilor, de ambele părţi, nu poate fi interpretată ca un indicator al susţinerii teoriei accesului la „conştiinţa universală” prin meditaţie, deoarece într-o abordare ştiinţifică este sarcina celui care propune o anumită teorie să ofere dovezi în sprijinul acesteia Caseta Sofismul de tip ad ignoratium utilizat frecvent pentru a inversa demersul ştiinţific În cei zece ani de practică psihoterapeutică folosind noua tehnică de terapie dinamică sinergetică nu s-a publicat niciun studiu care să demonstreze că tehnica ar fi una ineficientă Prin urmare, această formă de terapie este o tehnică validă de intervenţie psihoterapeutică Biasul de confirmare şi absenţa revizuirilor O diferenţă, sesizabilă pe termen lung, între teoriile ştiinţifice şi cele pseudoştiinţifice constă în acceptarea revizuirilor teoretice specifică abordărilor ştiinţifice Ştiinţa a fost deschisă mereu la corecţii şi adaptări ale teoriilor stipulate în acord cu datele obţinute În schimb, abordările pseudoştiinţifice au suferit puţine modificări de-a lungul timpului De exemplu, astrologia, ce-şi propune să facă predicţii asupra evoluţiei unei persoane în funcţie de poziţionarea exactă a astrelor la momentul naşterii, a rămas aproape neschimbată de de ani, cu toate că mişcarea axei Pământului în acest interval de timp a schimbat poziţia astrelor pe cer comparativ cu cea existentă cu patru milenii în urmă) (Hines, apud Lilienfeld şi Landfeld, ) Mai mult, pseudoştiinţele tind să se raporteze în mod subiectiv la rezultatele eventualelor studii efectuate, acceptându-le preferenţial doar pe acelea care le sunt convenabile, care sunt în acord cu teoria stipulată Dacă rezultatele susţin teoria enunţată, pseudoştiinţele folosesc aceste date ca mijloace pentru advocacy-ul şi marketingul teoriei respective Dacă rezultatele nu susţin teoria enunţată, există tendinţa de a ignora (minimaliza) aceste rezultate şi de a găsi tot felul de argumente (scuze) printre limitele metodologice ale studiului pentru a susţine în continuare teoria enunţată O asemenea tendinţă este observată şi printre abordările ştiinţifice, însă în acest caz procesul de evaluare colegială (peer-review) joacă rolul de a limita concluziile formulate, oricare ar fi acestea, ţinând seama de limitele metodologice pe care le are orice demers ştiinţific Accentul pe opinii şi pe cazuri particulare În justiţie, opiniile experţilor au o valoare însemnată în decizia pe care o ia judecătorul unui caz În ştiinţă, opiniile experţilor sunt irelevante dacă nu sunt susţinute de date empirice provenite din studii riguroase din punct de vedere metodologic Stanovich ( ) remarca, cu umor, că în medicină au fost formulate opinii favorabile atât din partea unor experţi, cât şi a unor beneficiari cu privire la valoarea curativă a dinţilor de porc, a excrementelor de crocodil, a prafului de pe mumiile egiptene şi a multor alte remedii trăsnite Nici „înţelepciunea populară” românească nu rămâne restantă la nivel imaginativ când este vorba de remedii curative naturiste pentru tot felul de probleme medicale sau psihologice În toate aceste cazuri, tratamentele nu pot distinge, pe baza unei simple mărturii, fie ea televizată şi sinceră, dacă efectul produs de acestea este unul real sau unul determinat de efectul placebo Am putea afirma că întreaga istorie a medicinei, înainte de secolul XX este doar o istorie a efectului placebo (Postman, ) Dar vindecarea nu este doar dependentă de cauza sugerată sau de efectul placebo Pot apărea alte situaţii precum existenţa unor variabile confundate, regresia către medie, remisia spontană, maturarea, evoluţia ciclică a tulburării etc Toate acestea pot conduce la o evoluţie favorabilă a unei tulburări (deficienţe) Studiile de caz prezintă aceleaşi neajunsuri Ele pot fi utile la nivel ştiinţific pentru generarea de ipoteze, dar nu şi pentru susţinerea (confirmarea) acestora Opiniile experţilor, bazate sau nu pe anumite studii de caz, reprezintă primul pas într-un demers ştiinţific, ce trebuie completat (verificat) prin realizarea de studii empirice Pseudoştiinţele ignoră acest pas esenţial, preferând utilizarea mărturiilor experţilor şi a datelor provenite din unele studii de caz, pe care le prezintă drept dovezi ştiinţifice de netăgăduit, despre eficienţa unei intervenţii anume Extinderea fără temei a concluziilor Orice program educaţional de metodologia cercetării subliniază ideea că rezultatele ştiinţifice trebuie privite în termenii limitelor pe care le-a avut studiul respectiv Ideea validităţii concluziilor extrase pe baza rezultatele obţinute într-o anumită cercetare este centrală pentru orice abordare ştiinţifică, de aceea ea a fost abordată şi dezvoltată pe larg în mai multe secţiuni ale acestei lucrări Pseudoştiinţele nu sunt preocupate de acest aspect Dimpotrivă, ele tind să nu diferenţieze, de pildă, între studii bazate pe surprinderea mecanismelor schimbării şi studii de tip efficacy sau effectiveness (vezi tabelul ) De asemenea, pentru pseudoştiinţe are puţină relevanţă dacă studiul este unul experimental sau unul non-experimental Prin urmare, nu ar fi exclus să constatăm că autorii unui simplu studiu comparativ non-experimental ce urmărea relaţia dintre muzica de relaxare şi nivelul anxietăţii de stare, să ajungă la concluzii extravagante, tipice unui demers pseudoştiinţific, precum cel prezentat în caseta Caseta Exemplu de extindere neîntemeiată a concluziilor Diferenţele semnificative statistic înregistrate între cei care au urmat şi cei care nu au urmat şedinţe de meloterapie, indică un nivel mai scăzut al anxietăţii în cazul primului grup Acest lucru îmbucurător este cauzat de fenomenul de rezonanţă ce apare între compoziţia vibratorie specială a muzicii şi mintea celui care o ascultă, inducând ascultătorului o stare psihică specială, de linişte şi armonie interioară Muzica, ne pune aşadar, în rezonanţă cu energii benefice din macrocosmos, influenţând benefic atât starea fizică, cât şi pe cea psihică Evitarea procesului de peer-review Publicul tinde să se încreadă mai mult într-o anumită teorie dacă aceasta a fost publicată în reviste de specialitate Pentru aceasta, ştiinţa apelează la procesul de evaluare colegială, cunoscut sub denumirea generică din limba engleză de peer-review Cu toate că nu este un mecanism perfect, acest proces este menit tocmai pentru a elimina de la publicare acele articole care au deficienţe metodologice majore şi/sau care prezintă concluzii eronate, ce nu sunt susţinute de datele empirice colectate În cele mai multe cazuri, pseudoştiinţele ocolesc acest proces, promovându-şi produsele direct, prin mijloace specifice marketingului comercial Pentru a-şi justifica această decizie, promotorii pseudoştiinţelor acuză revistele de specialitate că promovează ortodoxismul ştiinţific, că dau dovadă de conservatorism şi de rigiditate în politica editorială Această poziţie de „victimă” poate fi augmentată de enumerarea unor cazuri celebre de erori comise prin procesul de peer-review, conform cărora conceptele prea inovative pentru timpul în care au fost dezvoltate sunt privite cu circumspecţie de către comunitatea ştiinţifică, la fel cum s-a întâmplat şi în cazul teoriei relativităţii a lui Einstein Sprijin pentru holism Un mecanism de autoapărare prezent în cadrul multor pseudoştiinţe este apelul la complexitatea sistemului psihologic Atunci când teoriile sau enunţurile făcute nu corespund cu datele empirice colectate, auzim mereu explicaţii de genul: lucrurile sunt mult mai complexe şi nu trebuie privite izolat (Lilienfeld et al , ) Fie că este vorba de interpretarea unui element dintr-un test proiectiv (care mereu trebuie privit în mod contextualizat, coroborat cu informaţiile din anamneza pacientului, pentru a confirma presupoziţiile avute – n a ) sau că este vorba despre rezultatele unui studiu privind eficienţa unei tehnici de meditaţie asupra dezvoltării personale, prin apelul la holism avem acelaşi tip de discurs Dacă datele observate confirmă presupoziţiile avute, înseamnă că tehnica proiectivă sau meditaţia respectivă sunt tehnici valoroase Dacă datele observate infirmă aşteptările avute, înseamnă doar că „informaţiile oferite de testele proiective trebuie interpretate contextual şi dinamic, niciodată izolat de istoricul pacientului şi de dinamica elementelor din structura proiectivă analizată”, respectiv că „beneficiile meditaţiei au fost deja demonstrate ştiinţific, doar că, în acest caz, o serie de limite prezente în studiul realizat au afectat posibilitatea de a surprinde eficienţa acestei metode terapeutice” Holismul primeşte chiar o coloratură spirituală în multe dintre pseudoştiinţele aparţinând medicinei alternative În multe dintre aceste ştiinţe există trei idei de bază: (a) funcţionarea normală a energiei vitale asigură o stare de sănătate; (b) blocajul fluxului de energie conduce la o serie de afecţiuni; (c) deblocarea fluxului de energie vitală va restabili starea de sănătate (Bayerstein, ) De pildă, în acupunctură, acele sunt folosite pentru a debloca anumite canale energetice (meridiane) Dacă utilizarea tehnicii are efect este o dovadă a faptului că s-ar fi reuşit deblocarea canalelor energetice, astfel încât fluxul vital să funcţioneze În schimb, dacă utilizarea tehnicii nu are eficienţa scontată, semnifică faptul că problema este mult mai serioasă, că blocajul energetic este unul puternic, necesitând un timp şi un efort îndelungat pentru deblocare Se observă, aşadar, că în spatele acestui îndemn la o abordare holistă se regăseşte aceeaşi problemă a lipsei falsificabilităţii, aceasta fiind principala caracteristică distinctivă între ştiinţă şi pseudoştiinţă Sofismul ad antiquitatem Acest sofism porneşte de la ideea greşită că, dacă o idee a reuşit să supravieţuiască un interval lung de timp, fără a fi abandonată, însemnă că este o idee valoroasă „Vechii învăţaţi chinezi”, „înţelepciunea pierdută a vechilor civilizaţii” sunt numai câteva dintre formulările care încearcă să adauge forţă unor argumente prezentate, prin rezistenţa acestora în timp Abordarea New Age a încercat să găsească similarităţi între scrierile de filosofie orientală antice şi descoperirile recente din fizica cuantică Însă, aşa cum remarca Bayerstein ( ) interpretarea liberă a acestor similitudini se bazează pe acelaşi gen de speculaţii precum cele întâlnite în căutarea de similitudini dintre scrierile lui Nostradamus şi evenimentele petrecute de-a lungul timpului, pornind de la înclinaţia naturală a individului de a căuta semnificaţii pentru un anumit eveniment petrecut mai mult decât ar fi cazul (Hyman, ) Caseta Ilustrarea cumulativă a unor elemente descriptive specifice pseudoştiinţelor (adaptare după Marin, ) Eneagrama este un instrument psihologic foarte performant cu originea în înţelepciunea antică ce descrie nouă stiluri sau tipuri de personalitate, de fapt nouă stiluri diferite de a ne trăi viaţa Ce are unic eneagrama este faptul ca este singurul sistem psihospiritual care descrie personalitatea umană în totalitatea ei, ca un continuum de stări şi niveluri de conştiinţă, dezvăluind misterul stărilor contradictorii pe care le trăim Este o sinteză a celor mai noi teorii psihologice: teoria personalităţii multidimensionale, teoria relaţiei cu obiectul, teoria actualizării sinelui, dar şi a vechilor tradiţii esoterice Chiar simbolul eneagramei se crede că este un simbol de origine pitagoreică datorită proprietăţilor sale matematice speciale Aserţiuni generale şi/sau exagerate Tehnicile propuse de o bună parte dintre curentele ezoterice sau dintre abordările pseudoştiinţifice nu sunt unele oarecare, ci unele care neapărat aduc „o schimbare profundă în viaţa ta, o provocare enormă, vor revoluţiona sistemul tău de valori şi te vor ajuta să fii cu adevărat liber” De exemplu, terapia câmpului gândirii propusă de Callahan ( ) este o formă de psihoterapie considerată a fi pseudoştiinţifică, conform căreia gândurile şi experienţele trăite se transformă într-un câmp al gândirii, în cadrul căruia orice deformare semnifică o problemă emoţională Pentru a înlătura problemele noastre emoţionale e nevoie să îndreptăm deformarea câmpului gândirii, iar acest lucru se poate face prin mijloace tactile, dacă se apasă asupra anumitor meridiane energetice pentru a restabili echilibrul lui chi (qi – energia vitală în cultura tradiţională chineză) Pe lângă problematica în sine, legată de teoria ezoterică aflată la baza acestei forme de psihoterapie, există şi pretenţia susţinătorilor ei că intervenţia este utilă pentru orice fel de tulburare psihopatologică, ea putând fi aplicată nu numai la adulţi, ci şi la copii sau animale Însă nu toate abordările pseudoştiinţifice se rezumă la a oferi aserţiuni extravagante Dimpotrivă, unele abundă de aserţiuni general valabile sau de aserţiuni aparent valide În această categorie intră abordările care apelează frecvent la un discurs bazat pe efectul Barnum (aserţiuni general valabile, dar lipsite de valoare predictivă la nivel individual) (Forer, apud Pelham şi Blanton, ) De pildă, dacă cineva vă prezintă rezultatele unui test psihologic, conform cărora aflaţi că „sunteţi o persoană care se simte bine atunci când sunteţi apreciată de către ceilalţi, că uneori aveţi tendinţa de a fi mai critic(ă) cu dvs , că vă frustrează încercările celorlalţi de a vă impune anumite limite sau restricţii, că preferaţi un anumit grad de schimbare în viaţa dvs , dar fără a renunţa la valorile şi principiile care vă definesc ca persoană”, veţi afirma, foarte probabil, că instrumentul utilizat surprinde corect descrierea modului dvs de a fi Problema acestui gen de afirmaţii este că este general valabil, prin urmare nefalsificabil, deci neinclus într-o abordare ştiinţifică în psihologie Acest tip de afirmaţii general valabile conduce adeseori la proliferarea unui discurs ştiinţific de tipul „bunului-simţ”, la care recurg mulţi specialişti în încercarea lor de a oferi interpretări sau explicaţii pentru evenimente/fenomene psihologice pe care nu le cunosc foarte bine Astfel, revolta tinerilor este mereu un rezultat al nevoii lor nesatisfăcute de a fi trataţi de la egal la egal, ca nişte adulţi, iar problemele emoţionale ale copiilor având părinţii plecaţi la muncă în străinătate au drept sursă deficitul de afecţiune cu care ei se confruntă etc O categorie specială de interpretări specifice simţului comun este apelul la semnificaţia simbolică În Antichitate, Aristotel argumenta că gravitaţia reflectă dorinţa obiectelor de a se întoarce către pământul-sursă, la locul de care aparţin (Rensberger, apud Pelham şi Blanton, ) Desigur, fizica a avansat mult şi a renunţat la acest gen de explicaţii de sorginte animistă Nu acelaşi lucru se poate spune despre psihologie, care se confruntă încă cu acest gen de interpretări simbolice, chiar dacă nu de sorginte animistă De pildă, în grafologie, un scris mic şi înghesuit poate fi un semn al reticenţei sau zgârceniei persoanei respective, în timp ce un scris neîngrijit, cu multe erori, reflectă stilul expansiv şi impulsiv de a acţiona În alte domenii, cum ar fi comunicarea nonverbală, poziţia unui individ cu braţele încrucişate indică opoziţia şi reticenţa acestuia faţă de mesajul transmis, în timp ce unele teorii psihanalitice consideră actele de gelozie nimic altceva decât o expresie a neîncrederii în capacitatea propriei persoane de a rămâne fidel(ă) faţă de partenerul său La prima vedere, interpretările pot părea plauzibile, însă ele suferă puternic în ceea ce priveşte validitatea lor empirică, predictivă Abuzul de limbaj tehnic (specializat) În încercarea de a se apropia cât mai mult de abordările ştiinţifice, unele tehnici pseudoştiinţifice au împrumutat limbajul şi discursul ştiinţific pentru a-şi expune teoria De pildă, Herbert et al ( ; vezi caseta mai jos) prezintă modul în care autorii unei alte forme de psihoterapie considerată ca fiind pseudoştiinţifică – EMDR ( Eye Movement Desensitization and Reprocessing) îşi prezintă modelul procesării accelerate a informaţiei ca baza teoretică a intervenţiei într-o manieră ce pare credibilă Aşadar, este doar un stereotip faptul că pseudoştiinţele ar respecta patternul holismului şi al căderii în admiraţie pentru filosofia orientală antică Ele pot disimula foarte bine, utilizând un discurs ştiinţific elevat De notorietate rămâne farsa jucată de fizicianul Sokal care a reuşit să publice un text fără sens în revista postmodernistă Social text, primind acceptul evaluatorilor de a publica articolul cu titlul original „Transgressing the Boundaries: Towards a Transformative Hermeneutics of Quantum Gravity”, din cadrul căruia este prezentat un mic pasaj ca notă de subsol, păstrând varianta originală a textului, în limba engleză , reluat de Lilienfeld şi Landfield ( , p ) Caseta Exemplu de abuz în utilizarea unui limbaj tehnic (Herbert et al , , p ) „Receptorii neuronali (potenţialul sinaptic) incluşi în reţelele neuronale respective conţin niveluri diferite ale pragurilor de activare, denumite de la A la Z, în funcţie de valoarea adaptivă a informaţiei encodate Se presupune că reţelele neuronale ţintă Z au valori prea ridicate ale pragurilor de activare, ceea ce conduce la imposibilitatea conectării acestor reţele la alte reţele ce conţin informaţii cu valoare adaptivă Cele din urmă pot fi activate mai uşor, datorită valorii scăzute a pragurilor de activare Astfel, potenţialul sinaptic este diferit, pentru fiecare tip de afect encodat în diferite reţele neuronale (pragurile de activare fiind cele mai ridicate pentru acele reţele neuronale care encodează trăirile afective asociate evenimentului traumatic – n a ) Prin intermediul EMDR, pragul de activare a receptorilor neuronali din reţele scade, putându-se stabili conexiuni cu alte reţele ce conţin informaţie adaptivă, ale căror prag de activare neuronală este mai scăzut” Ideea evoluţiei/superiorităţii adepţilor Abordarea ştiinţifică nu conţine în discursul său referiri de ordin calitativ cu referire la adepţii uneia sau alteia dintre teoriile ştiinţifice Unele pseudoştiinţe tind să facă o asemenea diferenţă între cei care îmbrăţişează teoriile lor şi cei care nu cred în aceste idei Primii sunt cei care se consideră „evoluaţi spiritual”, „deschişi spre adevăr şi spre a surprinde esenţa Universului”, „pregătiţi pentru progres” „integraţi spiritual pe calea cunoaşterii sinelui profund, dincolo de orice iluzie a lumii materiale” Ceilalţi se află încă la un nivel „inferior”, „nepregătiţi să facă pasul spre progresul spiritual”, „prea rigizi şi dogmatici, reducţionişti”, „incapabili să sesizeze complexitatea universului şi legăturile ascunse, esenţele ultime” Absenţa conexiunilor cu teoriile anterioare şi cu celelalte ştiinţe În abordarea ştiinţifică, discursul se construieşte pas cu pas, pornind de la teoriile deja existente, aducându-li-se acestora corecţii, completări sau noi perspective pe baza unei analize critice Aceasta deoarece pentru a fi considerată ca un progres în cunoaştere, o teorie ar trebui să explice nu numai aspectele noi, ci să analizeze (integreze) modelele mai vechi din prisma noii teorii În multe dintre abordările pseudoştiinţifice lipseşte această conexiune cu teoriile anterioare Apare în schimb ideea că abordarea este una revoluţionară, ce necesită noi paradigme asupra realităţii Chiar dacă asemenea situaţii au apărut rar şi în domeniul ştiinţific (vezi trecerea la teoria relativităţii a lui Einstein), ele apar mult mai frecvent ca aserţiuni în justificarea unor construcţii teoretice din domeniul pseudoştiinţelor În plus, un atu important al unei teorii ştiinţifice este nu numai conexiunea cu teorii anterioare din domeniu, ci şi conexiuni dovedite ştiinţific cu alte ştiinţe În acest sens teoria szondiană a genelor pulsiunilor şi a destinului este vetustă dacă ne raportăm la rezultatele obţinute din cercetările genetice, lipsind fundamentarea biologică pentru o asemenea teorie Aşadar, în pofida dezvoltării extraordinare a interesului pentru psihologie, este nevoie de multă atenţie din partea comunităţii ştiinţifice psihologice de a nu cădea pradă abordărilor de tip pseudoştiinţific Nevoia societăţii contemporane de a găsi explicaţii psihologizante pentru o serie de evenimente şi situaţii cu care se confruntă avantajează, paradoxal, abordările de tip pseudoştiinţific, îndeosebi ca urmare a câtorva dintre caracteristicile acestora: (a) oferirea de explicaţii post eveniment prin intermediul unor teorii nefalsificabile; (b) mantaua holismului şi a legăturii cu spiritualitatea; (c) accentul pus pe confirmare prin apelul la opinii şi cazuri particulare, ce sunt mult mai uşor de obţinut decât dovezile experimentale Consecinţe negative ale abordării pseudoştiinţifice în psihologie Riscurile derivate din popularitatea curentelor pseudoştiinţifice printre consumatorii de psihologie sunt cu atât mai mari, cu cât în alte domenii apare o presiune inversă, de fundamentare ştiinţifică a oricărei practici profesionale, cel mai ilustrativ exemplu fiind abordarea validării ştiinţifice venită dinspre medicină (evidence based medicine – EBM) Astfel, un prim risc major ce apare în absenţa unei abordări ştiinţifice în psihologie este unul de ordin financiar De pildă, serviciile psihologice din zona asistenţei medicale se află în competiţie pentru fonduri cu alte domenii din sfera asistenţei medicale, inclusiv farmacoterapia Din acest punct de vedere, nevoia de servicii psihologice validate ştiinţific este una acută de vreme ce, deşi cheltuielile, în termeni procentuali, pentru servicii de sănătate mentală au rămas aproximativ constante în ultimii de ani, dinamica costurilor în interiorul acestor servicii a suferit modificări semnificative Astfel, costurile alocate pentru farmacoterapie au crescut, în timp ce cheltuielile pentru servicii de psihoterapie au scăzut, dacă ne raportăm în termeni procentuali (APA Task Force, ), iar acest aspect constituie un semnal de alarmă mai cu seamă că numărul de psihologi a crescut de patru ori în ultimii de ani (Goodheart, ) Aspectul principal care a condus la această stare de fapt a fost acela că, în lipsa unor resurse financiare suficiente, casele de asigurări au început să plătească doar acele servicii pentru care există dovezi de validitate ştiinţifică Cum domeniul farmacoterapiei a îmbrăţişat înaintea psihoterapiei ideea unei abordări bazată pe validarea ştiinţifică, constatăm o creştere a acestui tip de cheltuieli în dauna psihoterapiei, în cadrul categoriei de cheltuieli privind sănătatea mentală În strânsă legătură cu acest aspect, apare ideea creşterii responsabilităţii profesionale (accountability) în domeniul evaluărilor şi intervenţiilor psihologice În alte domenii din sfera sănătăţii mentale, o consecinţă importantă a abordării bazate pe validarea ştiinţifică a fost aceea a standardizării intervenţiilor prin dezvoltarea unor protocoale (proceduri standard de lucru) Acest aspect a permis tragerea la răspundere a celor care nu respectau metodologia de lucru, un aspect important atât pentru companiile de asigurări, cât şi pentru casele de sănătate, în demersul lor de a deconta serviciile prestate Numai o abordare bazată pe validare ştiinţifică va putea dezvolta, în timp, protocoale standard de intervenţie în cadrul psihologiei şi al psihoterapiei, care să permită evaluarea respectării responsabilităţii profesionale a specialiştilor din psihologie şi psihoterapie Un al treilea risc pe care îl presupune o abordare de tip pseudoştiinţific în sfera psihologiei este acela al izolării şi marginalizării domeniului, cel puţin în sfera serviciilor de sănătate mentală În contextul în care se tinde către oferirea de servicii integrate de sănătate mentală (APA Task Force, ; Spring, ) şi în care celelalte servicii din sfera medicală sunt fundamentate ştiinţific (psihiatria, farmacoterapia, asistenţa medicală – nursing), este necesar ca şi intervenţiile de tip psihologic să fie validate empiric, pentru a putea fi incluse în acest pachet integrat de servicii de sănătate mentală Acestor riscuri li se adaugă cel al percepţiei distorsionate a domeniului psihologiei, în contextul în care mulţi dintre absolvenţii de psihologie nu ţin cont în alegerea formării lor profesionale continue de perspectiva bazată pe validare ştiinţifică În următorul capitol al acestei părţi introductive sunt prezentate în detaliu caracteristicile unei practici validate ştiinţific în domeniul psihologiei Vom observa, cât de puţine dintre elementele prezentate acolo sunt incluse în practica uzuală a specialiştilor din psihologie şi psihoterapie Din nefericire, discursul majorităţii psihologilor, cel puţin din România, constituie încă un amalgam format din clişee lingvistice bazate pe simţul comun („copiii trebuie ajutaţi să-şi dezvolte încrederea în forţele proprii”) şi din opinii nevalidate empiric, preluate într-o manieră scolastică, pe parcursul formării profesionale continue („deoarece, aşa cum afirma Freud, pulsiunile sexuale constituie motorul comportamentului uman”) Descriptori ai unei abordări ştiinţifice Un element extrem de important de reţinut este acela că nu conţinutul studiat este cel care determină diferenţa dintre ştiinţă şi pseudoştiinţă De pildă, nu faptul că cineva decide să studieze fenomenele extrasenzoriale (premoniţii, precogniţii), adică subiecte contradictorii pentru lumea ştiinţifică, determină caracterul ştiinţific sau pseudoştiinţific al acestui demers Ceea ce constituie diferenţa este apelul la metoda ştiinţifică Dacă studiile efectuate utilizează o metodă ştiinţifică şi trec cu succes prin mecanismul de peer-review în cadrul unor reviste relevante pentru un anumit domeniu studiat, putem considera un asemenea demers ca fiind unul ştiinţific (vezi, de exemplu, studiul lui Bem ( ) despre precogniţii şi premoniţii publicat în prestigioasa revistă Journal of Personality and Social Psychology) În schimb, dacă studiile sunt caracterizate mai degrabă de indicatori specifici abordării pseudoştiinţifice, inclusiv acela de evitare a procesul de peer-review sau de simulare a acestuia în cadrul unor reviste marginale, de „cas(t)ă”, putem vorbi despre un demers pseudoştiinţific În bună măsură, indicatorii unui demers ştiinţific, pot fi identificaţi ca opusul celor specifici pseudoştiinţelor Astfel, abordarea ştiinţifică se bazează ca mecanism de funcţionare pe principiul falsificabilităţii, pe evitarea biasului de confirmare, pe existenţa revizuirilor teoretice etc Stanovich ( ) surprinde patru caracteristici definitorii pentru orice demers ştiinţific prezentate, pe larg, în cele ce urmează La acestea aş adăuga o altă caracteristică esenţială, aceea de a adopta o atitudine sceptică faţă de rezultatele obţinute în orice studiu, oferind o însemnătate deosebită explicaţiilor alternative  Figura Caracteristici definitorii ale unui demers ştiinţific Empirismul sistematic Oamenii manifestă psihologic înclinaţia de a face predicţii sau de a oferi explicaţii şi interpretări pentru evenimentele din viaţa lor Însă, în acest demers ei apelează rar la un demers ştiinţific, bazat pe ceea ce se numeşte empirism sistematic (Gravetter şi Forzano, ; Stanovich, ) În schimb, ei îşi bazează explicaţiile pe credinţe populare (de exemplu, „să nu stai pe colţul mesei pentru că nu te vei căsători”) sau pe intuiţii personale rezultate în urma experienţei personale care le creează senzaţia că au dreptate (de exemplu, o femeie gravidă care afirmă: „sunt convinsă că voi naşte o fetiţă pentru că simt sarcina diferit faţă de prima dată când am născut un băiat”) Este evident faptul că asemenea elemente nu pot face parte dintr-o abordare de tip ştiinţific O altă sursă care stă la baza modului lor de cunoaştere şi interpretare a lumii se referă la apelul la autoritate, fie aceasta una de ordin ştiinţific, filosofic sau religios În această categorie intră informaţiile furnizate de experţii dintr-un domeniu Cu toate că metoda este deosebit de economică în ceea ce priveşte consumul de timp sau de alte resurse, există un risc ridicat ca unele dintre aceste opinii să fie eronate De aceea, apelul la autoritate nu este considerat un element acceptabil din perspectiva unui demers ştiinţific, indiferent de prestigiul şi credibilitatea celui care a emis o anumită afirmaţie Acest lucru se întâmplă pentru că aceste opinii pot fi distorsionate (sau chiar eronate din punct de vedere ştiinţific, cum ar fi cazul explicaţiei deficitului de afectivitate matern ca o cauză pentru apariţia autismului emisă de psihanalistul Bruno Betellheim [Wikipedia, ]) Mai mult, presiunile exercitate de grupurile de advocacy cresc riscul emiterii unor opinii distorsionate care să susţină o cauză sau alta, în funcţie de interesul grupului de suport (de exemplu, vezi opiniile pro sau împotriva adopţiei internaţionale sau cele ale adopţiilor de către familii/cupluri de acelaşi sex) Nu în ultimul rând, un alt neajuns al fundamentării cunoaşterii pe deciziile unor experţi este acela al confuziei domeniului de expertiză Să ne înţelegem, doar pentru că o persoană a avut contribuţii importante într-un domeniu, nu înseamnă că mereu are dreptate Wundt, întemeietorul psihologiei ştiinţifice prin intermediul laboratorului de la Leipzig, nominalizat de două ori pentru acordarea premiului Nobel pentru medicină (Academia Premiilor Nobel, ), se declara împotriva votului universal („Franţa şi-a săpat mormântul prin reforma votului universal”, Wundt, apud Bringmann, Ungerer şi Bringmann, , p ) Tot el scria materiale de propagandă antiamericane şi antibritanice în Primul Război Mondial (New World Encyclopedia, ) În mod similar, numeroşi intelectuali români apreciaţi, inclusiv în zilele noastre, au făcut parte din ceea ce Eugen Ionescu denumea plastic fenomenul de rinocerizare a intelectualilor (apud Morar, ) Mircea Eliade a îmbrăţişat şi susţinut legionarismul, Mihai Eminescu, Nicolae Iorga, Constantin Noica sau Emil Cioran au scris numeroase texte cu conţinut antisemit, iar ultimul a mers chiar mai departe, aducând elogii lui Hitler şi lui Mussolini, precum şi ideii de stat totalitar (de exemplu, „Nu există om politic în lumea de astăzi, care să-mi inspire o simpatie şi o admiraţie mai mare decât Hitler”, în Vremea nr , din iulie apud Morar, ) De aceea este deosebit de important să reţinem că, din punct de vedere ştiinţific, valoarea unei idei sau opinii nu este judecată după CV-ul celui care o enunţă şi nici nu se transferă automat cu valoarea intelectuală a enunţătorului, deşi există înclinaţia retorică, întâlnită în cazul unora, de a-şi afişa toate titlurile şi distincţiile obţinute, înainte de a exprima o opinie, pentru a da un plus de greutate acesteia Mai mult, opiniile nu devin valide ştiinţific doar bazându-se pe prestigiul enunţătorului, chiar dacă ele vizează probleme din cadrul domeniului de expertiză al acestuia În acest sens, destul de cunoscută este afirmaţia eronată făcută de către Einstein, în , când afirma că sunt puţine indicii care să arate că se va putea obţine vreodată energie nucleară O altă sursă majoră de cunoaştere este apelul la raţionamentele logice Desigur, dacă premisele sunt adevărate şi dacă raţionamentul este unul corect din punct de vedere logic, cu siguranţă concluzia este una adevărată Din păcate, în realitate asistăm de multe ori la formularea de raţionamente pornind de la una sau mai multe premise eronate sau eşuăm în a identifica greşeli în modul de constituire a silogismelor Una dintre cele mai întâlnite erori privind raţionamentele în domeniul ştiinţific este sofismul afirmării consecinţei Dacă X, atunci Y Y Deci, X Transpus în termeni ştiinţifici acest gen de raţionament devine: Dacă teoria X este adevărată, atunci vom anticipa că obţinem Y; obţinem Y; deci, teoria X este adevărată Acest raţionament este unul greşit deoarece Y poate fi explicat, probabil, prin alte teorii alternative În exemplul: (a) „dacă a plouat recent, pământul este umed”; (b) „pământul este umed”; (c) „deci, a plouat recent” putem găsi şi alte explicaţii pentru care pământul ar fi umed (cum ar fi aceea de a fi fost stropit de către un grădinar) În schimb, raţionamentul ar fi unul corect dacă ar lua o altă formă logică, cum ar fi negarea consecinţei, precum în exemplul: (a) „dacă plouă recent pământul este umed”; (b) „pământul nu este umed”; (c) „deci, nu a plouat recent” Dacă X, atunci Y Non Y Deci, non X Transpus în logica ştiinţifică, raţionamentul corect este: Dacă teoria X este adevărată, atunci vom anticipa că vom obţine Y; nu obţinem Y; deci, teoria X nu este adevărată Pentru a complica şi mai mult lucrurile, chiar asemenea argumente construite corect pot ajunge în practică la concluzii greşite deoarece se pot strecura alte erori, de ordin metodologic, care să inhibe apariţia efectului Y În practică putem observa că pământul nu este umed, chiar dacă a plouat recent, dacă pământul avut sub observaţie este aşezat sub o copertină În mod similar, în studii de specialitate se pot strecura erori de ordin metodologic, care conduc la rezultate distorsionate În aceste condiţii nu înseamnă neapărat că teoria din spatele studiului este una greşită, ci este posibil ca anumite artefacte metodologice să conducă la eşecul observării efectului În plus, capacitatea de a raţiona corect, esenţială pentru a ajunge la concluzii adevărate, este afectată în cazul multora dintre oameni, care se lasă înşelaţi de aparenţe De exemplu, % dintre studenţii de masterat chestionaţi recent au afirmat că raţionamentul prezentat în partea stângă a casetei ar fi unul corect, în timp ce niciunul dintre masteranzi nu a considerat raţionamentul din partea dreaptă a aceleaşi casete ca fiind unul corect, deşi ambele au aceeaşi structură conform logicii propoziţionale Soluţia formală la acest gen de raţionamente poate fi oferită doar prin apelul la logica predicatelor Toţi X sunt M Unii M sunt Y Unii X sunt Y Caseta Exemplu de raţionament, identic propoziţional, care duce la concluzii diferite Toate femeile sunt fiinţe umane Unele fiinţe umane sunt psihologi Deci, unele femei sunt psihologi Toate femeile sunt fiinţe umane Unele fiinţe umane sunt bărbaţi Deci, unele femei sunt bărbaţi  O ultimă sursă importantă de cunoaştere este metoda empirică, bazată pe ideea de a colecta date despre situaţia existentă prin simpla observaţie Astfel, putem cunoaşte, de exemplu, că fiinţa umană are patru membre, două inferioare şi două superioare; că iarna nu este la fel de cald ca vara; că există un ciclu periodic al anotimpurilor etc Dar apelul exclusiv la observaţii şi date empirice, poate fi iluzoriu, aproape % dintre români cred că Soarele se învârte în jurul Pământului şi nu invers (Vlăsceanu, Duşa şi Rughiniş, ), iar un număr din ce în mai însemnat de copii cred că vacile au culoarea mov, preluând reprezentarea din celebra marcă de ciocolată (FDSC, ) Nu în ultimul rând, aceste observaţii empirice pot fi obiectul unor interpretări eronate, bazate pe credinţele, aşteptările şi cunoştinţele anterioare ale celui care face observaţia, ceea ce constituie o altă limită a cunoaşterii bazate exclusiv pe metoda empirică Ca urmare, toate sursele de informaţii prezentate anterior, fie că este vorba de intuiţii sau credinţe populare, de opinii ale unor autorităţi ştiinţifice sau religioase, de demersuri raţionale, logice sau de colectarea de date empirice, au o serie de limite care pot conduce la distorsionarea cunoaşterii Niciuna dintre ele nu se suprapune cu empirismul sistematic întâlnit într-o abordare ştiinţifică a cunoaşterii Însă ambii termeni conţinuţi în acest construct de empirism sistematic sunt definitorii Astfel, empirismul indică predispoziţia unui demers ştiinţific de a colecta date din realitate (empirism), cu precizarea că acest demers este unul sistematic (controlat, structurat), orientat spre testarea unei teorii Prin controlul efectuat asupra metodelor empirice de colectare a datelor se doreşte evitarea erorilor care ar conduce la obţinerea de date distorsionate despre realitate, iar prin caracterul structurat şi logic al acestui demers se are în vedere realizarea măsurătorilor (observaţiilor) într-un context specific, al testării unor teorii sau a unor modele, care să permită ulterior realizarea de inferenţe (predicţii, explicaţii) despre modul de funcţionare a realităţii, dincolo de ceea ce este imediat şi direct observabil, măsurabil Prin urmare, empirismul sistematic nu se rezumă la simpla observare a realităţii, la a colecta date, ci are în vedere un demers sistematic de verificare a unei teorii (ipoteze, predicţii) De aceea, cea mai mare parte dintre studiile realizate conţin cel puţin o ipoteză ce trebuie cercetată şi o teorie pe care aceasta se bazează (testarea unei teorii nefiind altceva decât demersul de generare şi de testare a unui set de ipoteze corelate, ce derivă din teoria respectivă) De aceea, prin empirism sistematic (vezi, spre ilustrare, caseta ), vom înţelege un demers complex ce cuprinde: (a) observarea realităţii prin prisma unei teorii (lentile de descifrare a realităţii); (b) generarea unei ipoteze cu scopul de a verifica realitatea observată; (c) testarea ipotezei printr-un demers investigativ adecvat; (d) finalizarea demersului printr-un răspuns care poate sprijini sau nu teoria formulată, într-o manieră indirectă, prin intermediul ipotezei generate din teoria respectivă Un lucru foarte important legat de acest demers sistematic empiric este faptul că niciodată în ştiinţă nu este corect să utilizăm expresii de genul „ipoteza este confirmată”, „teoria este dovedită (a fost demonstrată)”, ci doar expresii de tipul „ipoteza este susţinută”, „teoria este sprijinită de datele empirice colectate” Acest lucru se întâmplă pentru a evita sofismul afirmării consecinţei prezentat anterior Astfel, un rezultat ştiinţific conform căruia frecvenţa mai ridicată a viselor cu conţinut violent întâlnită în cazul băieţilor, comparativ cu cel al fetelor, poate fi interpretat diferit, atât ca un sprijin în favoarea teoriei psihanalitice a complexului lui Oedip (teama băieţilor de a fi castraţi de tatăl lor ca urmare a dragostei lor pentru mamă), cât şi ca o consecinţă a unor diferenţe de gen existente la nivel genetic (Coolican, ) Pe scurt, prin acest demers empiric sistematic, ştiinţa avansează prin formularea de teorii explicative pentru anumite fenomene observate, pe baza cărora se pot face o serie de predicţii a căror valoare de adevăr este testată prin demersul ştiinţific realizat În funcţie de rezultatele obţinute se poate ajunge, fie la sprijin pentru teoria respectivă şi la identificarea unor legităţi cu valabilitate largă, fie, dimpotrivă, la revizuirea teoriei respective, pentru a putea include rezultatele obţinute sau chiar la eliminarea teoriei respective, în cazul în care noile date obţinute nu pot fi explicate nici măcar de o variantă revizuită a teoriei respective Caseta Paşii unui demers empiric sistematic Ilustrarea unor cazuri ipotetice de studiu Paşii de lucru Exemplul Exemplul  Pasul Observarea realităţii prin prisma unei teorii În ultimele luni de zile am crescut în greutate Am observat, în aceeaşi perioadă, că am renunţat să mai practic orice activitate fizică intensă (asociere pe bază de inducţie) Este foarte probabil ca surplusul de calorii neconsumate să fie cauza creşterii în greutate (deducţie pe bază teoretică – cunoştinţe anterioare din domeniul nutriţiei) Se constată adesea, că mulţi dintre indivizii care renunţă la locul lor de muncă actual fac parte dintre cei care percep munca depusă ca fiind una extrem de solicitantă (lucrează mult, greu, în condiţii de stres), fiindu-le greu să facă faţă cerinţelor postului Din perspectivă teoretică, posturile solicitante sunt cele în care se intensifică riscul de a dezvolta probleme de sănătate fizică şi mentală printre angajaţi, mai cu seamă de către angajaţii care dispun de resurse puţine  Generarea ipotezei de lucru Demararea unui program de activităţi fizice va reduce/elimina tendinţa de a creşte în greutate (comparaţie între situaţia greutăţii mele în lunile în care nu am făcut sport vs lunile în care am făcut mişcare fizică intensă) Intenţia unui individ de a părăsi actualul loc de muncă se află în legătură cu nivelul de solicitare resimţit faţă de postul pe care îl ocupă Un nivel ridicat de solicitare resimţit pe post este asociat cu un risc mai ridicat al fluctuaţiei de personal  Testarea ipotezei de lucru În condiţiile menţinerii aceluiaşi regim alimentar, pentru a controla inputul energetic primit de organism, se colectează lunar date cu privire la greutate şi se compară diferenţele în greutate sesizate între lunile cu şi cele fără activitate sportivă Un lot de muncitori (indivizi cu autonomie decizională scăzută) este investigat prin intermediul a două chestionare standardizate şi validate din punct de vedere ştiinţific, ce măsoară gradul de solicitare resimţit pe post, respectiv nivelul intenţiei de a părăsi organizaţia în care lucrează  Integrarea răspunsului din perspectiva unei teorii S-a constatat o creştere în greutatea corporală în lunile fără activitate fizică intensă, fapt ce sprijină teoria surplusului de calorii neconsumate ce stă la baza creşterii în greutate Astfel, activitatea fizică este una din modalităţile de echilibrare calorică S-a constatat absenţa unei asocieri între intenţia de a părăsi compania şi nivelul de solicitare pe post În lipsa unor explicaţii ce vizează limite metodologice, un asemenea rezultat ar trebui să conducă la revizuirea modelului teoretic conform căruia suprasolicitările postului ( job strain) constituie un factor de risc în apariţia fluctuaţiei de personal De exemplu, în studii viitoare ar putea fi căutaţi factori moderatori de care depinde apariţia efectului menţionat în teorie, cu alte cuvinte să se arate că efectul suprasolicitării asupra fluctuaţiei de personal apare doar în anumite condiţii (de exemplu, un venit lunar nesatisfăcător)   Cunoştinţe verificabile public După empirismul sistematic, cea de a doua caracteristică majoră a oricărei abordări ştiinţifice este aceea de a permite verificarea publică a demersului realizat şi a rezultatelor obţinute Procedura de bază utilizată în acest sens este replicarea studiilor anterioare (Stanovich, ) Pentru ca acest lucru să se întâmple, orice demers ştiinţific este descris suficient de detaliat încât să permită altor persoane interesate să replice studiul pentru a urmări măsura în care sunt obţinute rezultate similare Această măsură poate fi privită ca o modalitate de protecţie împotriva erorilor apărute în procesul de testare a ipotezelor, fie ele erori de tip I (rezultate semnificative statistic, când nu există un efect), de tip II (rezultate nesemnificative statistic, când există un efect), de tip III (rezultate semnificative statistic, dar în sens contrar celui aşteptat) De asemenea, prin replicarea rezultatelor se oferă o siguranţă suplimentară că rezultatele nu sunt distorsionate de existenţa vreunor probleme metodologice În cadrul procesului de replicare ideal ar fi ca demersul de replicare să fie realizat de o altă echipă de cercetare decât cea care a descoperit iniţial efectul studiat, pentru a asigura o mai mare încredere în rezultatul replicat O altă modalitate esenţială de verificare publică a cunoştinţelor generate prin cercetări este aceea de a publica rezultatele în reviste de specialitate în care funcţionează evaluarea de tip colegial (peer-review) Chiar dacă acest proces nu este lipsit de subiectivitate, acesta constituie cel mai bun mijloc existent de a evalua critic corectitudinea demersului ştiinţific efectuat şi validitatea rezultatelor obţinute Deşi prin multitudinea de reviste de specialitate existente într-un domeniu (de exemplu, baza de date PsycInfo însumează peste de reviste de specialitate – Stanovich, ) se pot strecura şi studii cu rezultate invalide (problematice), absenţa supunerii rezultatelor unei cercetări la procesul de evaluare colegială este un semn clar a unui demers neştiinţific În cazul evaluării de tip peer-review rezultatele dobândesc o forţă ştiinţifică mai mare dacă sunt publicate: (a) în reviste ISI Web of Science de top, cu factor de impact ridicat pentru domeniul respectiv; (b) în reviste ce nu pot fi bănuite ca fiind revistele casei (de exemplu, un articol favorabil unei teorii noi să fie publicat într-o revistă distinctă de cea care este condusă chiar de autorul articolului respectiv sau de iniţiatorii şi/sau susţinătorii respectivei teorii) În sfârşit, un alt aspect relevant ca urmare a introducerii principiului verificării publice a cunoştinţelor este productivitatea crescută a oricărui domeniu ştiinţific, având loc frecvent (aproape cu fiecare deceniu) o revizuire sau înlocuire a teoriilor sau cunoştinţelor existente Acest progres rapid conduce treptat la consolidarea practicii psihologiei bazată pe validarea ştiinţifică (evidence based psychology practice), ceea ce presupune, în linii mari, implementarea de către practicieni a celor mai bune modalităţi de intervenţie pentru a soluţiona diferite aspecte practice, în urma testării eficienţei în studiile de specialitate Studiul problemelor rezolvabile Acum de ani, o problemă precum „reducerea simptomatologiei depresive prin intermediul realităţii virtuale” ar fi fost o temă care nu ar fi putut fi abordată ştiinţific Astăzi, datorită progresului ştiinţific, o asemenea temă poate fi abordată ştiinţific În schimb, o temă precum „studiul efectelor interacţiunii dintre oameni şi fiinţele extraterestre asupra imaginii de sine a fiinţelor umane” nu poate fi considerată a fi o abordare ştiinţifică în prezent, dar ea ar putea deveni o temă respectabilă de studiu în viitor, dacă omenirea va fi marcată în existenţa sa de asemenea evenimente potenţiale Cu alte cuvinte, pentru a fi considerată ştiinţifică, o abordare trebuie să apeleze la metode de investigaţie care să permită testarea empirică a problematicii studiate De aceea se poate pune un semn de egalitate între studiul problemelor rezolvabile şi cel de verificare a unor teorii sau modele explicative ce pot fi testate, adică verificate din perspectiva gradului lor de validare empirică Astfel demersul ştiinţific diferă fundamental de cel pseudoştiinţific prin faptul că abordările pseudoştiinţifice apelează la teorii şi concepte care nu pot fi falsificabile Un alt aspect important care distinge abordările ştiinţifice de cele neştiinţifice, în direcţia studierii unor probleme rezolvabile, este distincţia dintre operaţionalism şi esenţialism (Stanovich, ) Căutarea esenţei ultime (de exemplu, „care este sensul vieţii?”, „ce înseamnă cu adevărat altruismul?”, „care este esenţa moralităţii?”) nu face parte dintr-o abordare ştiinţifică Abordarea ştiinţifică în această direcţie ar încălca principiul problemelor rezolvabile (nu dispunem, cel puţin momentan, de metode empirice de investigare a acestor aspecte) şi prin urmare nu s-ar supune principiului falsificabilităţii, orice explicaţie oferită rămânând la nivelul unei speculaţii de tip filosofic Soluţia pentru a aborda ştiinţific o temă este de a renunţa la esenţialism şi de a operaţionaliza conceptele studiate Ideea de bază a operaţionalismului este aceea că, oricât de abstract ar fi la prima vedere un construct, acesta ar trebui măsurat empiric printr-un indicator observabil La prima impresie acest lucru este uşor de realizat, de exemplu, pentru a măsura nivelul inteligenţei generale a unei persoane cineva poate apela la rezultatul global obţinut de persoana respectivă la scalele de inteligenţă Wechsler pentru adulţi – WAIS-IV (Wechsler, ) Însă modul de operaţionalizare a unui construct teoretic abstract poate conduce la indicatori variaţi, rezultaţi în urma unor decizii complexe care pot afecta demersul ştiinţific la nivelul validităţii sale de construct (vezi secţiunea ) De pildă, pentru evaluarea satisfacţiei maritale se poate apela la un indicator de autoraportare global pe o scală Likert în cinci trepte („Per ansamblu cât de satisfăcut(ă) sunteţi de relaţia pe care o aveţi cu soţia (soţul) dvs ?”) sau la un indicator multidimensional bazat pe evaluarea relaţiei dintre parteneri cu privire la mai multe aspecte: sexual, afectiv, de într-ajutorare cu privire la aspectele administrative etc O altă modalitate de operaţionalizare a gradului de satisfacţie în relaţia de cuplu ar putea fi prin intermediul unei grile de observare completată de o persoană terţă, care are acces să urmărească relaţia de cuplu periodic Desigur, alte elemente luate în considerare pot afecta răspunsurile celor chestionaţi precum: perioada de raportare (în general, în ultimele şase luni etc ), utilizarea unor ancore facilitatoare cu rol comparativ (de exemplu, una este instrucţiunea de exprimare a gradului de satisfacţie în comparaţie cu celelalte cupluri pe care le cunoaşteţi, alta este exprimarea evaluării în comparaţie cu aşteptările pe care le aveţi de la partener) La acestea se adaugă eventualele limite ale metodelor utilizate, cum ar fi tendinţa celor chestionaţi să ofere răspunsuri dezirabile social De aceea este important ca în orice demers de operaţionalizare a conceptelor studiate să se bazeze pe proceduri validate anterior (vezi secţiunea destinată validităţii de construct) Prin definirea operaţională a constructelor uzitate, abordarea ştiinţifică evită definirea ambiguă, poetică a unor concepte atât de sensibile în psihologie precum inteligenţa, dragostea, performanţa etc Totuşi, acest demers pragmatic nu este lipsit de critici, precum acuzele de definire tautologică a constructelor analizate (de exemplu, inteligenţa este ceea ce testele de inteligenţă măsoară) Caseta Formulări PICO pentru studii din zona psihologiei şi a psihoterapiei Studii clinice controlate Studiul diferenţelor existente la nivelul depresiei (O) între adolescenţii delincvenţi (P) care au urmat o terapie cognitiv-comportamentală (I) şi cei care au beneficiat de un program de consiliere standard, uzual (C)  Studii longitudinale efectuate pe eşantioane largi Copii adoptaţi (P) de către cupluri în care cel puţin unul dintre părinţi a suferit ulterior un episod psihopatologic din Axa I a DSM, necesitând tratament de specialitate (I) au un risc mai crescut să fie afectaţi de vreo tulburare mentală din Axa I (O) comparativ cu cei adoptaţi de cupluri fără istoric psihopatologic (C)  Studii corelaţionale cu rol predictiv Introducerea evaluării conştiinciozităţii (I) la candidaţii pentru poziţii în domeniul vânzărilor din industria textilă (P) prezice performanţa lor ulterioară în muncă (O)  În aceeaşi direcţie a studiului unor probleme rezolvabile, o variantă utilă de lucru este de a formula tema studiată utilizând algoritmul PICO întâlnit în domeniul practicii validate ştiinţific Formatul PICO (Spring, ) este utilizat pentru a formula întrebări de cercetare testabile Denumirea reprezintă acronimul de la populaţia investigată (Population), intervenţia evaluată (Intervention), elementul comparativ evaluat (Comparison) şi de la rezultatul obţinut (Outcome) Dintre cele patru componente, elementul comparativ evaluat este singurul care poate avea un caracter opţional, însă doar pentru cazul acelor studii care pot fi derulate adecvat în absenţa unui grup de control (de exemplu, studiile corelaţionale) Conectivitate cu teoriile şi studiile anterioare Pentru a avea credibilitate ştiinţifică, orice teorie sau model nou propus ar trebui să poată explica datele obţinute, cel puţin la fel de bine ca teoriile deja existente Mai mult, teoriile şi modelele noi devin superioare celor existente dacă reuşesc să explice dinamica rezultatelor acolo unde teoriile anterioare din domeniu au eşuat să facă acest lucru În general, modelele explicative sunt interconectate între ele interdisciplinar De pildă, modelul evoluţionist are aplicaţii variate în psihologie, biologie, economie O teorie este cu atât mai solidă cu cât este susţinută de datele colectate din diverse domenii de studiu Aceste aspecte menţionate sunt importante de reţinut atunci când evaluăm potenţialul ştiinţific al unor modele alternative propuse Astfel, Stanovich ( ) oferă exemplul a două intervenţii ipotetice menite să amelioreze dificultăţile de citire ale elevilor din primul ciclu şcolar, în contextul în care despre niciuna dintre ele nu există date empirice privind eficienţa lor terapeutică Să denumim cele două forme de intervenţie A, respectiv B Intervenţia A presupune antrenarea conştientizării din partea copilului a caracterului segmentar al limbajului la nivel fonologic (prin exerciţii de despărţire în silabe) Intervenţia B presupune antrenarea sensibilităţii la nivel vestibular a copiilor (prin exerciţii repetate de mers pe bârnă cu ochii închişi) În contextul în care intervenţia A se bazează pe unele dovezi empirice anterioare (de exemplu, existenţa unei corelaţii între dificultăţile de citire şi nivelul scăzut de conştientizare a caracterului segmentar al cuvintelor), iar intervenţia B nu se fundamentează pe rezultatele niciunui studiu anterior, este de preferat să se propună intervenţia A ca modalitate de lucru, chiar dacă încă nu sunt disponibile rezultatele vreunui studiu clinic controlat care să demonstreze eficienţa intervenţiei de tip A În sfârşit, asociată ideii de conectivitate este şi principiul convergenţei dovezilor, conform căruia, ştiinţa progresează treptat, pe măsură ce anumite teorii primesc tot mai mult sprijin prin invalidarea explicaţiilor alternative Niciun studiu nu este perfect Orice studiu are o serie de limite privind validarea sa, ca urmare este nevoie de un set de dovezi convergente (unele experimentale, altele obţinute într-un context ecologic, altele longitudinale etc ) pentru a ajunge la un progres De aceea, ştiinţa tinde să se bazeze din ce în ce mai mult pe rezultatele studiilor cantitative, de tip metaanalitic, pentru a răspunde unei probleme analizate şi pentru a găsi noi aspecte de investigat Scepticism şi căutarea explicaţiilor alternative Ar putea părea neobişnuit, dar unul dintre aspectele importante într-un demers ştiinţific este tocmai atitudinea sceptică în faţa afirmaţiilor sau dovezilor prezentate de terţi Astfel, chiar pentru situaţii destul de evidente precum acelea că frustrarea este asociată cu agresivitatea sau că nivelul de inteligenţă prezice performanţa şcolară, oamenii de ştiinţă au nevoie de dovezi concrete pentru că nu se pot baza doar pe simţul comun, pe intuiţie, sau pe opinia neverificată a vreunei autorităţi în domeniu Mai mult, chiar în contextul în care îi sunt prezentate dovezi în sprijinul afirmaţiilor respective, următorul pas într-un demers ştiinţific corect nu este acela de a jubila şi a proclama că acesta este adevărul absolut, ci de a pune alte întrebări cu rol cârcotaş precum: „Există alte studii care să contrazică rezultatele găsite de noi?” sau „Ce alte teorii alternative (variabile confundate) ar putea explica (conduce la) acest rezultat?” Pentru a ilustra importanţa unei atitudini sceptice în ştiinţă voi apela la exemplul oferit de Coolican ( ), cu referire la războiul dintre giganţii băuturilor răcoritoare Coca-Cola şi Pepsi Cei de la Pepsi au prezentat un studiu realizat pe băutorii de Coca-Cola conform căruia mai mult de jumătate dintre consumatorii obişnuiţi de Coca-Cola au considerat gustul băuturii Pepsi ca fiind mai bun decât cel al Coca-Cola, dacă băuturile erau servite din două pahare denumite M şi Q, fără a şti însă în care dintre pahare se servea Pepsi, respectiv Coca-Cola În realitate, pentru o înregistrare cât mai corectă a studiilor, Pepsi era servită din paharul cu denumirea M, iar Coca-Cola din paharul cu denumirea Q Impactul publicitar al acestui studiu a avut efect, raportul de vânzări în favoarea Coca-Cola scăzând de la un raport de la , la unul de la Această evoluţie a vânzărilor i-a determinat pe cei de la Coca-Cola să argumenteze că studiul anterior a fost construit inadecvat, pentru că a oferit din start un avantaj pentru Pepsi Cola care fusese servit din pahare inscripţionate cu litera M, deoarece există o preferinţă implicită a oamenilor (cel puţin a vorbitorilor de limbă engleză) pentru litera M (de exemplu, mama) mai ridicată decât pentru litera Q De aceea, au realizat un alt studiu în care participanţii erau manipulaţi să creadă că trebuie să aleagă între două băuturi răcoritoare, puse în pahare inscripţionate cu M, respectiv Q S-a constatat că un număr semnificativ mai ridicat persoane preferau băutura din paharul M comparativ cu cea din paharul Q, deşi în amândouă era acelaşi conţinut – Coca-Cola! Deşi aparent, Coca-Cola a oferit un răspuns consistent, care a oferit o explicaţie alternativă pentru rezultatele primului studiu, alta decât cea dorită de cei de la firma Pepsi, niciunul dintre cele două studii nu a fost realizat adecvat pentru a răspunde la întrebarea legată de preferinţa pentru una sau alta dintre băuturile răcoritoare De exemplu, cel de-al doilea studiu, deşi a reuşit să ofere o explicaţie alternativă faţă de cea prezentată de cei de la Pepsi, nu a reuşit să indice dacă rezultatele din primului studiu se datorează în totalitate preferinţei implicite pentru anumite litere sau dacă acest efect este doar unul care moderează intensitatea preferinţei existente pentru Pepsi faţă de Coca-Cola, la nivel de gust În opinia noastră, cel puţin două măsuri de control a variabilelor străine ar fi trebuit luate în primul studiu pentru a elimina posibilele explicaţii alternative În primul rând ar fi vorba de contrabalansarea tipului de băutură prezentată în paharele de tip M, respectiv de tip Q, precum şi de contrabalansarea ordinii de prezentare a acestor băuturi (pornind de la premisa că este posibil ca al doilea pahar gustat să nu aibă acelaşi efect gustativ decât primul, mai ales pentru participanţii însetaţi) Astfel, dacă jumătate dintre participanţi ar fi primit Pepsi în pahare de tip M, iar cealaltă jumătate în pahare de tip Q (şi viceversa pentru Coca-Cola) am fi controlat efectul preferinţei implicite pentru anumite litere şi l-am fi putut lua în calcul De asemenea, dacă jumătate dintre participanţi ar fi băut mai întâi Pepsi, iar cealaltă jumătate ar fi băut mai întâi Coca-Cola, am fi putut controla şi lua în calcul şi efectul de ordine a degustării băuturilor Un asemenea design, nu le-ar fi permis celor de la Coca-Cola să aducă drept explicaţie alternativă ideea că efectul se datorează preferinţei pentru anumite litere, nu diferenţelor de gust dintre băuturi Desigur, chiar şi în cazul prezenţei contrabalansării, atitudinea sceptică faţă de rezultatele obţinute ar fi putut fi invocată De pildă, s-ar putea ca rezultatele să fie distorsionate din cauza faptului că studiile nu au fost derulate în condiţii de tip dublu-orb În cele două studii derulate, doar participanţii nu cunoşteau ce se află în cele două pahare, în schimb experimentatorii ştiau E posibil, chiar fără voia lor, să fi influenţat decizia participanţilor la studiu, cei de la Pepsi având o atitudine mai apropiată faţă de participanţi în momentul în care aceştia degustau din paharul M (de Pepsi), iar cei de la Coca-Cola să transmită involuntar mesaje non-verbale care să-i influenţeze în mai mare măsură pe participanţi să prefere băutura din paharul inscripţionat cu litera M Un design dublu-orb, în care nici participanţii, nici asistenţii de cercetare care intrau direct în contact cu cei investigaţi, nu ar cunoaşte tipul de băutură servită, asociat cu aplicarea măsurilor de contrabalansare pentru a controla efectele de ordine sau alte variabile străine cum ar fi preferinţa pentru anumite litere, ar fi condus la un studiu experimental bine controlat, care să înlăture eventualele critici (explicaţii alternative) venite din partea celorlalţi Istoria ştiinţei este plină de asemenea exemple, poate cel mai celebru dintre ele fiind cel legat de malarie, a cărei denumire originară din limba franceză, provine tocmai de la credinţa falsă că era declanşată de aerul rău din zona mlaştinilor (Mitchell şi Jolley, ) Au fost efectuate chiar unele studii, arătând că există un număr mai mare de îmbolnăviri în locuinţele din apropierea bălţilor şi a mlaştinilor decât în zonele cu teren uscat Desigur, ce s-a neglijat în aceste explicaţii iniţiale este faptul că şi ţânţarii, adevăratul mijloc de transmitere a bolii, se află într-un procent mai mare în zona bălţilor şi a mlaştinilor decât în zone cu teren arid Concluzii Fascinaţia societăţii actuale pentru domeniul psihologiei este în creştere În special mass-media preia şi dezbate teme din domeniul psihologiei într-o măsură mai mare decât se întâmplă în cazul altor ştiinţe Însă deseori dovezile ştiinţifice sunt înlocuite de simple speculaţii bazate pe intuiţie şi pe simţul comun La aceasta se adaugă confuziile legate de asocierea psihologiei cu alte domenii precum parapsihologia, curentele de tip New Age, medicina alternativă, precum şi întreaga industrie de tip self-help Însă, poate cel mai puternic pericol provine tocmai din tagma psihologilor Destul de mulţi colegi nu reuşesc să facă distincţia dintre abordarea ştiinţifică şi pseudoştiinţă Dacă la nivel stilistic, există un oarecare stereotip format despre pseudoştiinţe (vezi segmentul de jos al figurii ), la nivelul conţinuturilor şi al metodelor utilizate diferenţa rămâne, pentru mulţi, una nesesizabilă Pseudoştiinţele tind să fetişizeze rezultatele pozitive obţinute, să ignore dovezile contrare, să abuzeze de explicaţii post hoc fără a le supune verificării şi să-i acuze pe cei care contestă mesajul lor Într-un fel, este naturală această tendinţă umană de a căuta dovezi pentru a susţine ceea ce crezi, cu atât mai mult într-un domeniu precum psihologia despre care multă lume are impresia că se pricepe În ştiinţă se procedează într-un mod diferit Ştiinţa nu este definită de tema pe care o studiază, ci de metodologia pe care o aplică în studierea temelor respective Aceasta trebuie să fie riguroasă (empirism sistematic), iar rezultatele obţinute să se supună controlului public şi atitudinii sceptice manifestate de către colegii de breaslă Cunoştinţele care trec cu succes prin aceste filtre sunt singurele care pot fi considerate ca fiind întemeiate, utile pentru evoluţia ştiinţei şi practicii psihologice Până la urmă este lăudabil faptul că cei mai mulţi dintre cei care aleg să studieze psihologia fac acest lucru pentru că „vor să-i ajute pe ceilalţi” sau pentru că „vor să se cunoască mai bine pe ei înşişi” Însă, pentru a realiza aceste lucruri, este nevoie să se utilizeze informaţii şi tehnici validate empiric, pe care numai o abordare ştiinţifică le poate oferi O asemenea abordare merită promovată inclusiv în rândul acelora care se simt atraşi de misterele psihologiei, care utilizează teorii şi concepte psihologice doar pentru a da sens şi semnificaţie propriilor experienţe de viaţă şi care sunt mai mereu predispuşi să ofere post hoc interpretări psihologizante pentru evenimentele trăite Pentru mulţi dintre ei poate părea straniu să abordezi ştiinţific teme precum dragostea romantică, însă înţelegerea mecanismelor psihologice implicate în acest caz, într-o manieră validată ştiinţific, va ajuta la prevenirea şi la combaterea depresiei, a violenţei domestice şi va contribui la ameliorarea vieţii de cuplu Ştiinţa psihologiei nu face altceva decât să filtreze informaţiile din zona psihologiei pe baza datelor factuale şi să corecteze credinţele greşite, astfel încât să-i ajute mai eficient pe oameni şi să contribuie, prin cunoaştere, la progresul societăţii Lecturi suplimentare Skeptical Inquirer (revistă de specialitate) Această revistă este editată cu scopul de a evalua într-o manieră critică, folosind metode ştiinţifice, orice afirmaţie sau concluzie exagerată (neacoperită), care a trecut de filtrul evaluării colegiale şi a fost publicată în reviste ştiinţifice recunoscute Tema preferată de analiză este domeniul parapsihologiei, dar fără a se limita doar la aceasta Scott O Lilienfeld, Steven Jay Lynn, John Ruscio, Barry L Beyerstein ( ) de mari mituri ale psihologiei populare Înlăturarea concepţiilor greşite despre comportamentul uman Bucureşti: Editura Trei Cartea prezintă într-o manieră jurnalistică de mituri celebre din domeniul psihologiei (de exemplu, „ne folosim doar % din capacitatea creierului”) pe care le analizează din perspectiva gradului lor de fundamentare ştiinţifică Subtitlul cărţii este unul ilustrativ: înlăturarea concepţiilor greşite despre comportamentul uman Scott O Lilienfeld, Steven Jay Lynn, Jeffrey M Lohr ( ) Science and Pseudoscience in Clinical Psychology New York: Guilford Press Lucrarea este principala referinţă bibliografică care delimitează între abordările ştiinţifice şi cele pseudoştiinţifice în domeniul psihoterapiei În linii mari lucrarea analizează cele mai întâlnite forme de intervenţie psihoterapeutică, precum şi practicile de evaluare clinică, din perspectiva măsurii în care acestea îndeplinesc criteriile pentru a fi considerate demersuri validate ştiinţific Daniel David ( ) Castele de nisip Ştiinţă şi pseudoştiinţă în psihologia clinică Bucureşti: Editura Tritonic Cartea constituie primul semnal de alarmă în spaţiul românesc cu privire la răspândirea curentelor pseudoştiinţifice în domeniul psihologiei clinice şi a psihoterapiei Keith E Stanovich ( ), How to think straight about psychology (ediţia a IX-a) Boston: Pearson Lucrarea este una de referinţă prin faptul că reuşeşte să prezinte publicului, într-un limbaj accesibil, cum să diferenţieze între abordările riguroase, ştiinţifice din psihologie şi încercările pseudoştiinţifice din domeniu Este o lucrare care ar trebui introdusă obligatoriu în pregătirea academică a oricărui student la psihologie Bibliografie Academia Premiilor Nobel ( ) The Oficial Web Site for Nobel Prize Wilhelm Wundt Găsit la adresa http://www nobelprize org/ APA ( ) Presidential Task Force on the Future of Psychology Practice Final Report Găsit la adresa http://www apa org/pubs/info/reports/future-practice pdf Bayerstein, B L ( ) Distinguishing science from pseudoscience Găsit la adresa: http://www sld cu/galerias/pdf/sitios/revsalud/beyerstein cience vs pseudoscience pdf Bem, D J ( ) Feeling the future: experimental evidence for anomalous retroactive influences on cognition and affect Journal of Personality and Social Psychology, , pp - Bringmann, W G , Ungerer, G A , Bringmann, M W ( ) Wilhelm Wundt and the workers’ educational movement Psychologie und Geschichte, , pp - Callahan, R J ( ) Thought Field Therapy: Response to our critics and a scrutiny of some old ideas of science Journal of Clinical Psychology, , pp - Coolican, H ( ) Research methods and statistics in psychology (ediţia a IV-a) Londra: Hodder & Stoughton David, D ( ) Scrisoare către babilonieni Disponibilă la adresa http://www psihologiaonline ro/component/content/article/ -psihologul-daniel-david-avertizeaza-politicienii html FDSC ( ) Newly emerging needs of children in Romania An exploratory study raport al Fundaţiei pentru Dezvoltarea Societăţii Civile, găsit la adresa http://www scribd com/ doc/ /Newly-Emerging-Needs-of-Children-in-Romania-Exploratory-Study Goodheart, C D ( ) Economics and psychology practice: What we need to know Professional Psychology: Research and Practice, , pp - Gravetter, F J , Forzano, L -A ( ) Research methods for the behavioral sciences (ediţia a IV-a) Belmont: Wadsworth Henriques, G R , Sternberg, R ( ) Unified professional psychology: Implications for the combined-integrated model of doctoral training Journal of Clinical Psychology, , pp - Herbert, J D , Lilienfeld, S O , Lohr, J M , Montgomery, R W , O’Donohue, W T , Rosen, G M , Tolin, D F ( ) Science and pseudoscience in the development of eye movement desensitization and reprocessing: Implications for clinical psychology Clinical Psychology Review, , pp - Hyman, R ( ) Cold reading: How to convince strangers that you know all about them The Skeptical Inquirer, , pp - Jansz, J ( ) Psychology and society: an overview În J Jansz şi P van Drunen (eds ), A social history of psychology (pp - ) Oxford, UK: Blackwell Publishing Kaminer, W ( ) I’m Dysfunctional, You’re Dysfunctional: The Recovery Movement and Other Self-Help New York: Addison Wesley Kendler, H H ( ) The role of value in the world of psychology American Psychologist, , pp - Knapp, S , Keller, P A ( ) Professional associations’ strategies for revitalizing professional psychology Professional Psychology: Research and Practice, , pp - Levant, R F ( , Ianuarie ) Making psychology a household word National Psychologist, găsit la adresa http://nationalpsychologist com/ / /making-psychology-a-household-word/ html Lilienfeld, S O , Landfield, K ( ) Science and pseudoscience in law enforcement: A user-friendly primer Criminal Justice and Behavior, , pp - Lilienfeld, S O , Lohr, M , Morier, D ( ) The teaching of courses in the science and pseudoscience of psychology Teaching of Psychology, , pp - Lilienfeld, S O , Lynn, S J , Lohr, J M ( ) Science and pseudoscience in clinical psychology: Initial thoughts, reflections, and considerations În S O Lilienfeld, S J Lynn şi J M Lohr (eds ), Science and pseudoscience in clinical psychology (pp - ) New York: Guilford Lilienfeld, S O , Lynn, S J , Ruscio, J , Beyerstein, B L ( ) de mari mituri ale psihologiei populare Bucureşti: Editura Trei Louw, J ( ) Psychology, history, and society South-African Journal of Psychology, , pp - Marin, G ( ) Ce este eneagrama? Găsit la adresa http://www empower ro/inteligenta-emotionala/ce-este-eneagrama/ Mitchell, M L Jolley, J M ( ) Research design explained (ediţia a VI-a) Belmont :Wadsworth Publishing Morar, O ( ) Intelectualii români şi „chestia evreiască” Contemporanul Ideea Europeană, , disponibil la adresa http://www romaniaculturala ro/articol php?cod= New World Encyclopedia ( ) Wundt Wilhelm Disponibil la adresa http://www newworldencyclopedia org/entry/Wilhelm Wundt Patrick, J ( ) The economic value of psychology in Australia: Australian Psychologist, , pp - Pelham, B W , Blanton, H ( ) Conducting research in psychology Measuring the weight of smoke (ediţia a III-a) Belmont: Thompson Wadsworth Popper, K ( ) Logica cercetării Bucureşti: Editura Ştiinţifică Postman, N ( ) Amusing ourselves to death: Public discourse in the age of show business New York: Penguin Saeman, H ( , July) Survey: Psychologists’ incomes plummet The National Psychologist, , pp - Savage, M ( ) Psychology and contemporary society Modern Intellectual History, , pp - Spring, B ( ) Evidence-based practice in clinical psychology: What it is, why it matters; what you need to know Journal of Clinical Psychology, , pp - Stanovich, K E ( ) How to think straight about psychology (ediţia a IX-a) New York: Pearson Vlăsceanu, L , Duşa, A , Rughiniş, C (coord ) ( ) Ştiinţă şi societate Interese şi percepţii ale publicului privind cercetarea ştiinţifică şi rezultatele cercetării Raport de cercetare disponibil la adresa http://www stisoc ro/docs/STISOC Raport% de% cercetare pdf Wechsler, D ( ) Wechsler Adult Intelligence Scale (ediţia a IV-a) San Antonio: Pearson Wikipedia ( ) Bruno Bettelheim Găsit la adresa http://en wikipedia org/wiki/ Bruno Bettelheim Deşi cererea de servicii psihologice este în creştere la nivel mondial, trebuie menţionat faptul că ritmul de creştere al cererii este sub cel de creştere a ofertei de servicii psihologice, fapt reflectat prin tendinţa de scădere a nivelului de salarizare pentru psihologi (Saeman, ), de creştere a şomajului în rândul tinerilor absolvenţi de psihologie (Knapp şi Keller, ) şi de creştere a numărului de psihologi care au o opinie defavorabilă despre această profesie şi care i-au în considerare o schimbare a domeniului de activitate (Knapp şi Keller, apud Henriques şi Sternberg, ) „In mathematical terms, Derrida’s observation relates to the invariance of the Einstein field equation under nonlinear space-time diffeomorphisms (self-mappings of the space-time manifold that are infinitely differentiable but not necessarily analytic) In this way, the infinite-dimensional invariance group erodes the distinction between observer and observed; the p of Euclid and G of Newton, formally thought to be constant and universal, are now perceived in their ineluctable historicity; and the putative observer becomes fatally decentered, disconnected from any epistemic link to a space-time point that can no longer be defined by geometry alone ” În aceeaşi direcţie, aspecte care ţin direct de sfera spiritualităţii pot fi abordate ştiinţific (de exemplu, influenţa rugăciunilor asupra emoţiilor, substratul neurobiologic al stărilor meditative, rolul religiozităţii în sănătatea mentală etc ) Spre deosebire de alte caracteristici ale unui abordări ştiinţifice (vezi figura ), empirismul sistematic are o sferă de aplicabilitate limitată, îndeosebi la nivelul ştiinţele empirice (naturale, ale vieţii, sociale), fiind mai puţin potrivit pentru a descrie situaţia întâlnită în cadrul ştiinţelor formale (matematică, logică) Ştiinţele formale (analitice) nu sunt interesate de validarea teoriilor pe baza observaţiilor colectate, ci de analiza proprietăţilor unor sisteme formale pe baza unor definiţii şi a unor reguli de operare Unii autori consideră drept demersuri ştiinţifice şi topicile care nu reprezintă probleme rezolvabile în prezent (de exemplu, căutarea fiinţelor extraterestre), atâta timp cât metodologia din studiile respective respectă condiţia falsificabilităţii În asemenea cazuri nu se oferă însă răspunsuri definitive cu privire la tematica investigată, iar uneori se poate ajunge la situaţia stranie în care lipseşte însăşi dovada existenţei obiectului de studiu Ceea ce contează este ca problemele să fie rezolvabile în principiu, nu neapărat în prezent Astfel pot rezulta ipoteze interesante şi se poate acumula un corp important de cunoştinţe (de exemplu, studiul condiţiilor extreme în care poate apărea viaţa) Capitolul Practica psihologică validată ştiinţific Definirea şi descrierea practicii validate ştiinţific Capitolul anterior are meritul de a trece în revistă principalele diferenţe dintre o abordare ştiinţifică şi una pseudoştiinţifică, cu referire îndeosebi la specificul psihologiei ca ştiinţă Însă, abordarea ştiinţifică nu vizează doar sfera academică, ci ar trebui să se reflecte inclusiv în practica psihologilor De altfel, un deziderat frecvent întâlnit în programele de formare profesională a psihologilor este acela de a forma ceea ce în limba engleză se numeşte scientist practitioners, cu alte cuvinte, de a pregăti specialişti care să fie buni practicieni, dar care să posede şi abilităţi de cercetare Idealul unui „practician-cercetător” este acela de a-şi fundamenta practica pe soluţii validate ştiinţific Pentru a năzui spre acest deziderat, practicienii trebuie să fie consumatori critici ai literaturii de specialitate Aceasta presupune atât căutarea de informaţii ştiinţifice pertinente pentru problemele din practica profesională, cât şi capacitatea de a discerne între diferitele soluţii de intervenţie existente, luând în calcul eficienţa lor, dovedită prin studii empirice De asemenea, un practician-cercetător manifestă un interes direct pentru producerea de cunoaştere, reflectată printr-un comportament activ în manifestări profesionale (Gaudiano şi Statler, ; Overholser, ) Această viziune despre practica psihologică a fost teoretizată iniţial încă din anii ‘ ai secolului trecut, fiind cunoscută şi sub numele de modelul Boulder, un model originar din zona psihologiei clinice (Striker, ) Un alt concept important este cel de practică validată ştiinţific (evidence-based practice sau EBP) Între conceptul de EBP şi cel de practician-cercetător există o suprapunere ridicată, chiar dacă cele două aspecte nu au un istoric comun Practica validată ştiinţific (EPB) îşi are originea în domeniul ştiinţelor medicale, unde a cunoscut o dezvoltare foarte puternică Atât ca urmare a unor similitudini ridicate dintre domeniul clinic al medicinei şi al psihologiei, cât şi ca urmare a similarităţilor conceptuale dintre conceptul de practician-cercetător şi cel de specialist care oferă servicii validate ştiinţific (bazate pe dovezi empirice), transferul dintre medicină spre psihologie s-a făcut mai întâi în zona psihologiei clinice, dar se extinde din ce în ce mai mult în toate ariile de interes ale psihologiei Practica validată ştiinţific vizează în primul rând cerinţa ca în deciziile din practica profesională să se ia în calcul implementarea de soluţii pentru care există dovezi validate ştiinţific cu privire la eficienţa lor Deşi se are în vedere rolul de producător de cunoaştere (realizator de cercetări), accentul cade pe rolul de consumator critic al literaturii de specialitate, în vederea identificării soluţiilor cu cel mai ridicat nivel de eficienţă La fel de importantă este expertiza profesională a practicianului de a putea decide contextual dacă soluţiile oferite de literatura de specialitate sunt potrivite pentru problema concretă de rezolvat Astfel, pe lângă aspectele ştiinţifice, se ţine seama de nevoile şi aşteptările clientului, astfel încât decizia de a selecta o anumită formă de intervenţie să se facă având consimţământul clientului Aşa cum am precizat, cele două concepte discutate diferă ca origine Dacă conceptul de practician-cercetător a fost dezvoltat de psihologii clinicieni, ideea practicii validate ştiinţific îşi are originea în domeniul medicinei De altfel, o definiţie consacrată a EBP susţine că aceasta este un proces care implică analizarea într-o manieră responsabilă, explicită, a dovezilor existente în literatura de specialitate cu privire la eficienţa diferitelor forme de intervenţie, cu scopul de a lua decizii adecvate cu privire la modul de îngrijire a unui pacient (Sackett, Rosenberg, Gray, Haynes şi Richardson, ) În sfârşit, în literatura de specialitate unele surse (APA, ) fac o altă delimitare între EBP şi intervenţiile validate ştiinţific (empirically supported treatments sau EST) Conform acestora, EBP, deşi face apel la identificarea intervenţiilor validate ştiinţific pentru problema avută, presupune mai mult decât atât, fiind un demers complex de tip ideografic (APA, ), în timp ce intervenţiile validate ştiinţific constituie o componentă integrată în EBP, rezultată în urma unei abordări de tip nomotetic (de exemplu, analiza studiilor de specialitate pentru a răspunde la întrebarea: „este terapia familial-sistemică o modalitate eficientă de intervenţie în cazul adolescenţilor care au aflat recent că au fost înfiaţi?”) Astfel, EST vizează cu precădere intervenţia, în timp ce EBP vizează cu precădere clientul, utilizând informaţiile cu privire la intervenţiile validate ştiinţific ca unul dintre inputurile necesare pentru a lua cea mai bună decizie pentru clientul asistat (APA, , Levant şi Hasan, ) Astfel, conform acestei viziuni EBP se referă la procesul integrării informaţiilor din literatura de specialitate (cu privire la cele mai eficiente intervenţii validate ştiinţific), cu expertiza practică, în contextul analizei preferinţelor şi a caracteristicilor culturale şi demografice ale clienţilor care solicită servicii psihologice (APA , Spring, ), pentru a se atinge efectul dorit de client (de exemplu, reducerea nivelului de conflict muncă-familie, creşterea satisfacţiei maritale, reducerea anxietăţii sociale, creşterea performanţei şcolare etc ) Acest model de conceptualizare a EBP este cunoscut şi sub numele de modelul scaunului cu trei picioare (the three legged-stool) (Spring, )  Figura Cele trei braţe ale practicii validate ştiinţific Pe scurt, EBP înseamnă a lua decizii în baza expertizei profesionale, a caracteristicilor clientului şi a informaţiilor la zi cu privire la cele mai eficiente tipuri de intervenţie pentru a soluţiona problema întâlnită Conceptul de EBP s-a răspândit rapid din domeniul medicinei spre alte profesii din zona sănătăţii (psihologie clinică şi psihoterapie, asistenţă medicală, farmacie), dar şi în domenii diferite precum management, pedagogie sau asistenţă socială (Briner şi Rousseau, ; Craig şi Smyth, ; Gibbs, ; Kratochwill şi Shernoff, ; Noonan, ; Norcross, Beutler şi Levant, ; Rousseau, ; Sackett, Strauss, Richardson, Rosenberg şi Haynes, etc ) Pentru a vedea mai concret ce ar însemna o abordare EBP în practica psihologică, vom ilustra în tabelul întrebările de bază la care ar trebui să răspundă un psiholog organizaţional atunci când ar fi solicitat, în calitate de consultant, să rezolve problema fluctuaţiei de personal dintr-o companie În funcţie de răspunsurile găsite la aceste întrebări (sau măcar la cea mai mare parte a acestora), psihologul va căuta să ia cea mai bună decizie pentru a soluţiona problema respectivă Tabelul Întrebări specifice unei abordări EBP pentru reducerea fluctuaţiei de personal Perspectiva practicianului A Există cazuri similare anterioare în portofoliul meu de servicii? Ce soluţii au fost propuse? Au funcţionat? A Care cred că sunt cauzele şi soluţiile posibile în acest caz? A Este o situaţie specifică companiei sau este afectată întreaga industrie de ramură şi/sau zonă în care este localizată firma? A Care este profilul organizaţiei beneficiare? A Care este politica actuală a companiei pentru a preveni fluctuaţia de personal? A Există date interne utile (de exemplu, chestionare aplicate la plecarea din firmă pentru a vedea motivaţiile specificate/profilul celor care pleacă sau alte studii care să indice situaţia actuală privind intenţia de a părăsi organizaţia)? A Care sunt cauzele fluctuaţiei în opinia conducerii companiei? A Ce soluţii au aplicat competitorii direcţi pentru a rezolva această problemă?  Perspectiva cercetătorului B Care este rata fluctuaţiei de personal în acest domeniu? B Care sunt principalele cauze (factori de risc) ale fluctuaţiei de personal, rezultate din analiza critică a literaturii de specialitate? B Există intervenţii validate ştiinţific ţintite pentru a reduce fluctuaţia de personal? B Care este utilitatea lor practică (mărimea efectului)? B Cât de puternice sunt dovezile pe care le avem despre eficienţa intervenţiilor identificate (care este nivelul lor de validare ştiinţifică, de suport empiric)? B Cât de relevante sunt studiile respective (cât de bine se potrivesc) luând în calcul contextul particular al organizaţiei beneficiare? B Care dintre intervenţiile eficiente s-a dovedit a avea cel mai bun raport cost-beneficiu?  Perspectiva clientului C Soluţia propusă ar stârni reactanţă (rezistenţă) din partea personalului firmei? C Care este opinia conducerii despre soluţia propusă? C Ce alte soluţii ar fi preferate/sunt luate în calcul de către conducerea companiei? C Ce consecinţe negative (efecte secundare nedorite) ar putea apărea în urma aplicării intervenţiei propuse? C Care ar fi poziţia conducerii faţă de aceste consecinţe secundare? C Ce dificultăţi sunt probabile să apară în procesul de implementare a intervenţiei? C Ce alte probleme neidentificate explicit de client pot fi rezolvate (diminuate) prin intervenţia propusă?  Totuşi, o serie de surse recente tind să trateze cele două concepte de EST şi EBP ca fiind sinonime (APA, Divizia de Psihologie Clinică, ) Conform acestora, EBP este un concept integrator care indică orice tip de activitate (intervenţii validate ştiinţific – EST, evaluări validate ştiinţific – ESA, evidence based assessment) pentru care există suport ştiinţific Conform acestei interpretări, EBP nu reprezintă altceva decât EST, ci reflectă un concept integrator/sinonim, pentru a cuprinde orice activitate practică (inclusiv componenta de evaluare psihologică), organizată pe baza aceloraşi principii enunţate mai sus De aceea, destul de mulţi autori utilizează EBP şi EST alternativ, fără a face distincţie între ei (David, comunicare personală, aprilie ) Necesitatea tranziţiei către o practică validată ştiinţific Cadrul conceptual privind EBP este unul extrem de atrăgător, fapt ce a condus la expansiunea şi îmbrăţişarea modelului dincolo de zona ştiinţelor medicale, unde rămâne însă cel mai bine răspândit În realitate, însă, cei mai mulţi practicieni, inclusiv din domeniu medicinei, se raportează la acest cadru ca la un model normativ, prescriptiv Dacă analizăm nivelul descriptiv, vom constata faptul că cei mai mulţi psihologi practicieni rămân blocaţi la nivelul perspectivei practicianului din tabelul Din această perspectivă, în cazul EBP există o mare discrepanţă dintre teorie şi practică De pildă, doar aproximativ jumătate dintre medici studiază literatura de specialitate pentru a lua decizii în practica lor curentă (Bennett et al , ; Humphris, Littlejohns, Victor, O’Halloran şi Peacock, ) Nu se cunoaşte însă cifra celor care evaluează critic informaţia citită, nici a celor care decid o soluţie luând în calcul şi preferinţele/valorile pacientului De asemenea, mai puţin de % dintre manageri citesc studii de specialitate pentru a-şi fundamenta deciziile (Rynes, Giluk şi Brown, ) Discrepanţa dintre modelul teoretic şi proba realităţii este una foarte mare şi în domeniul psihologiei (Wilson, Armoutliev, Yakunina şi Werth Jr , ) Din nefericire, cel mai adesea deciziile practicienilor se bazează mai degrabă pe cutume profesionale introduse, fie în baza unei analize raţionale, a intuiţiei sau a simţului comun, fie pur şi simplu în baza unui comportament mimetic („pentru că aşa au procedat şi alţii”) Foarte rar deciziile din practica psihologică se bazează pe dovezi empirice, validate ştiinţific Caseta Două cazuri specifice de intervenţii nevalidate ştiinţific Exemplul Programul de „înfricoşare directă” (scared straight), adaptare după Petrosino, Turbin-Petrosino şi Buehler ( ) Ideea programului a venit de la un film documentar distins cu premii de specialitate în , în care un grup de adolescenţi delincvenţi era pus faţă în faţă cu un grup de infractori periculoşi Aceştia îi intimidau pe adolescenţi cu scopul de a-i speria şi de a-i determina să realizeze că se află pe un drum greşit care le va aduce multă suferinţă, dacă nu renunţau la comportamentele lor delincvente Ideea a fost preluată şi introdusă în practică pe scară largă, îndeosebi în SUA şi în Marea Britanie pe deţinuţi adolescenţi şi tineri Aceştia erau expuşi în direct în faţa unor confraţi condamnaţi la închisoare pe viaţă cu scopul de a conştientiza consecinţele unei asemenea perspective şi a-i speria să nu ajungă ca ei, astfel încât să nu comită acte de recidivă Asemenea programe par să funcţioneze deoarece % dintre cei care au intrat în program nu au recidivat ulterior (comparaţii făcute exclusiv pe grupul beneficiar, fără vreun grup de control) Surpriză însă! În urma unei analize adecvate (ce presupune compararea evoluţia deţinuţilor care au beneficiat de acest program cu cele ale deţinuţilor din grupurile de control, în cadrul unor studii randomizate), se observă un efect dăunător al programului Şansele de a comite infracţiuni sunt cu aproximativ % mai mari în cazul celor care au participat la acest program decât în cazul celor care nu au „beneficiat” de o asemenea măsură corectiv-educativă Cu excepţia unui singur studiu, în toate celelalte cercetări au fost obţinute efecte negative semnificative statistic Exemplul Programele educative adresate tinerilor şoferi din Marea Britanie cu scopul de a reduce numărul de accidente rutiere, adaptare după Ig şi Kwan ( ), actualizat în Un asemenea program educativ ar fi necesar dacă am lua în considerare două cifre statistice: tinerii cu vârsta între şi de ani reprezintă % din populaţia celor care deţin un permis de conducere în UK, dar produc % din totalul accidentelor, ceea ce înseamnă că este un grup-ţintă predispus să comită accidente de circulaţie În baza unui sondaj de opinie (chestionar) cu o rată de răspuns de %, s-a constatat că tinerii care au urmat un program de educaţie rutieră şi-au modificat atitudinea în direcţia oferirii unor răspunsuri ce indică o atitudine prudentă în trafic, reducând riscul apariţiei accidentelor de circulaţie Această comparaţie s-a bazat pe un studiu de tip pretest-posttest fără un grup de control, cu o distanţă de luni între testări, acestea având loc înainte şi după implementarea programului educativ Statul britanic a investit mulţi bani în extinderea acestui tip de programe pe scală largă, deşi datele obţinute în urma unei evaluări serioase a literaturii de specialitate evidenţiază faptul că asistăm la o risipă de bani publici Astfel, analizând eficienţa acestor programe de formare (incluzând doar studii randomizate) se constată că nu există diferenţe semnificative între cei care urmează asemenea programe şi cei din grupul de control cu privire la frecvenţa implicării în accidente de circulaţie Cu alte cuvinte, nu există sprijin empiric solid pentru eficienţa acestor programe de educaţie rutieră Dincolo de specificul celor două problematici discutate, ar fi esenţial pentru orice practician din sfera psihologiei, care adoptă o atitudine profesionistă, să înţeleagă că: a) pentru rezolvarea diverselor probleme apărute nu este suficient ca intervenţiile selectate să se bazeze doar pe opinii ale specialiştilor cu privire la ceea ce ar putea să funcţioneze; de exemplu, a afirma că statul ar trebui să investească mai mulţi bani în programe de educaţie rutieră pentru a reduce numărul tinerilor implicaţi în accidente de circulaţie pare o soluţie de bun-simţ, întâlnită frecvent în discursul public sau de tip jurnalistic; este însă nevoie să existe dovezi empirice că programele respective ar fi eficiente pentru a lua în calcul asemenea soluţii într-o abordare de tip EBP; b) dovezile empirice în favoarea uneia sau alteia dintre formele de intervenţie nu sunt egale din perspectiva validităţii lor ştiinţifice (de exemplu, studiile randomizate sunt preferabile studiilor de tip non-experimental); de aceea adepţii EBP ar trebui să poată distinge între diferite tipuri de studii, din perspectiva calităţii dovezilor oferite de acestea (vezi detalii în secţiunea a acestui capitol); c) la ora actuală nu există dovezi validate ştiinţific pentru orice tip de intervenţie propusă; de aceea ar trebui să se facă o distincţie între intervenţiile derulate în absenţa dovezilor validate ştiinţific (pentru care nu există studii) şi intervenţiile care nu sunt sprijinite de dovezile colectate (studiile nu susţin eficienţa intervenţiei); intervenţiile din cea de-a doua categorie ar trebui eliminate din practica curentă, în timp ce intervenţiile din prima categorie pot fi luate în seamă doar dacă nu există alte intervenţii validate ştiinţific, a căror eficienţă a fost demonstrată; d) din perspectiva EBP, identificarea unei intervenţii validate ştiinţific în urma analizei critice a literaturii de specialitate este o măsură necesară, chiar esenţială, dar nu şi suficientă; alegerea intervenţiei ar trebui să ţină seama şi de alte aspecte existente precum: ( ) resursele avute la dispoziţie (raportul cost-eficienţă, vezi capitolul ); ( ) validitatea ştiinţifică a cadrului conceptual, a teoriei pe care se bazează intervenţia (detalii în secţiunea a acestui capitol); ( ) caracteristicile individului sau a grupului pe care se doreşte a fi implementată soluţia Pentru explicaţii suplimentare legate de ultimul punct menţionat (d), voi ilustra cazul abandonului şcolar Impactul pe termen mediu şi lung al acestei probleme este unul negativ, atât pentru indivizii în cauză (şomaj crescut, risc crescut de infracţionalitate, calificare profesională scăzută), cât şi pentru societate, prin costurile sociale pe care le generează În vederea prevenirii abandonului şcolar au fost încercate de-a lungul timpului mai multe tipuri de intervenţii care ar putea fi grupate în: (a) intervenţii educaţionale la nivel şcolar (restructurarea curriculei, a orarului pentru activităţile de şcoală/reducerea raportului de elevi per cadru didactic etc ); (b) intervenţii educaţionale la nivel individual (meditaţii, asistenţă în rezolvarea temelor de casă); (c) intervenţii educative în comunitate (implicarea elevilor în activităţi educative non-formale cum ar fi proiecte comunitare de asistenţă a vârstnicilor pentru a surprinde elemente ce ţin de biologie, psihologie, istorie etc ); (d) intervenţii comunitare legislative (de exemplu, programe de tip „cornul şi laptele” sau amendarea părinţilor care nu îşi monitorizează copiii şi care nu se îngrijesc ca aceştia să frecventeze şcoala în ciuda unor atenţionări repetate prealabile primite prin scrisori de informare); (e) programe de consiliere a părinţilor cu privire la importanţa şcolii şi la consecinţele abandonului şcolar; (f) intervenţii cu scopul dezvoltării unor abilităţi psihologice individuale la elevi (îmbunătăţirea nivelului de autoeficacitate educaţională, reducerea distresului legat de şcoală, îmbunătăţirea atitudinii faţă de şcoală) etc În faţa unui număr atât de însemnat de opţiuni, primul impuls ar fi acela de a decide intervenţia cea mai potrivită în urma unei dezbateri între specialişti, luând în calcul opiniile acestora sau experienţa unor studii de caz Într-o perspectivă EBP, demersul de soluţionare este diferit, modelul standard impunând implementarea succesivă a celor cinci paşi necesari (Sackett et al , ): ( ) reformularea problemei principale sub forma unei întrebări de investigat (pe cât posibil sub forma modelului PICO explicitat în cadrul secţiunilor şi din carte); în exemplul oferit, să spunem că se urmăreşte implementarea unei soluţii la nivel local (şcolile arondate psihologului şcolar), motiv pentru care soluţiile (a) şi mai ales (d) nu sunt fezabile, depinzând de modificări la nivel de sistem, iar soluţia (e) este puţin aplicabilă, deoarece este vorba de o comunitate cu foarte mulţi părinţi plecaţi la muncă în străinătate; în consecinţă rămân în analiză pentru pasul soluţiile (b), (c) şi (f) şi întrebarea de a vedea care dintre cele trei variante este mai eficientă în prevenirea abandonului şcolar; ( ) analiza literaturii de specialitate în vederea identificării de dovezi empirice valide din punct de vedere ştiinţific, cu privire la cea mai eficientă formă de intervenţie pentru a preveni abandonul şcolar, precum şi a factorilor moderatori care pot augmenta efectul (vârsta şcolarilor, tipul de comunitate – urban/rural etc ); în această direcţie sunt căutate în special studii metaanalitice (vezi capitolul ); pentru problematica abandonului este identificat un astfel de studiu în cadrul colecţiei Campbell (Wilson, Tanner-Smith, Lipsey, Steinka-Fry şi Morrison, ) ce sintetizează de studii; concluzia studiului metaanalitic este aceea că toate cele trei soluţii sunt eficiente, reducând abandonul şcolar (vezi figura ); Tabelul Trei criterii şi întrebări fundamentale aferente întâlnite în faza de evaluare critică a analizei de specialitate (pasul ) Validitatea Mă pot încrede în rezultatele studiilor respective?  Importanţa practică Efectul produs este suficient de mare pentru a avea o relevanţă practică?  Aplicabilitate Pot utiliza aceste informaţii în cazul concret de rezolvat?  ( ) evaluarea critică a rezultatelor provenite din analiza literaturii de specialitate; deşi toate cele trei soluţii par a fi eficiente în prevenirea ratei de abandon şcolar, cea care implică elevii în programe educaţionale non-formale ce presupun servicii pentru comunitate pare a fi cea mai eficientă (riscul de abandon şcolar fiind de , ori mai mic pentru cei care au fost implicaţi în astfel de programe comparativ cu cei aflaţi în loturi de control); totuşi, pentru acelaşi tip de intervenţie se observă şi variabilitatea cea mai mare în eficienţa programelor (intervalul de încredere sugerând valori cuprinse între , şi , ), ceea ce înseamnă că efectul este dependent de o multitudine de factori, fiind mai puţin robust; tot din perspectiva încrederii în rezultate se poate urmări dacă aceste valori se bazează preponderent pe studii experimentale (randomizate) sau sunt obţinute în special din studii de tip cvasiexperimental (vezi detalii despre acest subiect în secţiunea şi în capitolul ); în exemplul dat cele mai multe date provin din studii cvasiexperimentale ceea ce reduce, într-o oarecare măsură, nivelul calitativ al dovezilor privind eficienţa acestor forme de intervenţie;  Figura Rezultatele metaanalizei efectuate de Wilson et al ( ) Legendă: marcate cu steluţă sunt cele trei intervenţii de interes; n – număr de mărimi ale efectului; k – număr de studii independente; raportul şanselor (detalii legate de interpretarea metaanalizei în capitolul , secţiunile şi ); ( ) luarea deciziei şi implementarea intervenţiei selectate; în privinţa deciziei se au în vedere toate cele trei componente incluse într-o abordare de tip EBP (informaţii privind intervenţiile validate ştiinţific existente, privind caracteristicile şi valorile clientului şi din expertiza profesională a profesionistului); de exemplu, într-o asemenea decizie, ţinând cont că orice formă de intervenţie necesită resurse, se poate lua în calcul nu numai eficienţa intervenţiei, ci şi un raport cost-eficienţă; de asemenea se poate analiza gradul de similaritate între contextul în care urmează să se implementeze intervenţia selectată şi cel al studiilor în care a fost validată intervenţia respectivă; astfel, dacă % dintre studiile care implementau programe educaţionale non-formale cu implicarea comunităţii vizau elevi proveniţi din familii de imigranţi de primă generaţie din comunităţi multiculturale, acestea s-ar putea să fie inadecvate pentru a fi aplicate în prevenţia abandonului şcolar din satele româneşti; nici varianta dezvoltării de abilităţi psihologice nu ar fi posibilă într-un asemenea context din lipsa unui personal calificat în acest mediu pentru aplicarea intervenţiilor psihologice; pe scurt, în judecarea situaţiei practice întâlnite se va ţine cont atât de specificul contextual, cât şi de dovezile ştiinţifice existente cu privire la eficienţa intervenţiei respective; în sfârşit, în privinţa implementării soluţiei selectate, acest lucru ar trebui să fie realizat în baza unui ghid (protocol) de aplicare, pentru a maximiza şansele de reproducere a efectelor pozitive din studiile de specialitate; ( ) monitorizarea şi evaluarea eficienţei intervenţiei; în urma aplicării intervenţiei este important să se urmărească dacă şi-a atins scopul pentru care a fost implementată, precum şi ce dificultăţi (implicit măsuri corective) au fost identificate ca fiind necesare în aplicarea intervenţiei Din nefericire, există o discrepanţă mare între acest algoritm prescriptiv de lucru, specific EBP, şi realitatea de zi cu zi Deşi o ştiinţă matură ar trebui să se bazeze mai mult pe protocoale standard de intervenţie (vezi modelul EBP promovat în medicină) decât pe impresii şi intuiţii personale, se întâmplă adesea ca măsurile de intervenţie luate de mulţi specialişti din domeniul psihologiei să fie bazate pe soluţii decise intuitiv, fără o analiză aprofundată a celor mai bune practici din domeniu Acest lucru este facilitat şi de existenţa unor bariere în aplicarea modelului EBP, cele mai importante fiind sintetizate în tabelul Tabelul Bariere întâlnite în aplicarea modelului EBP în practica psihologică Barieră Descriere  Timp limitat Uneori li se solicită psihologilor să ofere ad-hoc recomandări practice Într-o abordare EBP ar fi nevoie, de cele mai multe ori, de timp pentru a consulta literatura de specialitate şi a identifica intervenţii validate ştiinţific pentru problematica respectivă  Acces limitat la resurse În contextul în care se publică atât de mult, iar cea mai importantă bază de date din domeniul psihologiei (PsycInfo) este accesibilă doar în regim contra cost, practicienilor le este greu să realizeze o evaluare adecvată a literaturii de specialitate  Abilităţi reduse de cercetare Multor practicieni le lipsesc cunoştinţele necesare pentru a analiza critic literatura de specialitate, inclusiv la nivelul de a diferenţia între studii în funcţie de calitatea dovezilor ştiinţifice Aceste abilităţi pot fi dobândite în special prin programe doctorale sau prin programe masterale serioase, însă nu toţi practicienii au un asemenea nivel de pregătire profesională  Presiune scăzută de profesionalizare Spre deosebire de alte domenii unde specializările sunt foarte precise, în domeniul serviciilor de psihologie sau conexe acesteia se întâmplă frecvent să existe consultanţi cu pregătire variată (ingineri, economişti etc ) În plus, deşi există o specializare inclusiv în domeniul psihologiei (de exemplu, psiholog clinician, psiholog educaţional etc ), există multe cazuri de practicieni cu atestat în multiple specialităţi, fiind greu de crezut faptul că aceştia pot performa în toate specialităţile pe care le deţin De asemenea, erorile întâlnite în actul psihologic sunt rareori supuse unui demers de malpraxis, cum se întâmplă adesea în cazul serviciilor medicale, prin urmare există mai puţină presiune de tip punitiv cu privire la consecinţele deciziilor luate în practica psihologică  Diversitatea conceptuală În psihologie există o multitudine de direcţii teoretice cu un aparat conceptual propriu, fapt care conduce adesea la suprapuneri şi ambiguităţi terminologice Această diversitate de opinii creează dificultăţi în acceptarea unui model comun, pragmatic, cum este cel bazat pe EBP, mai ales din partea practicienilor adepţi ai unor perspective teoretice mai puţin fundamentate ştiinţific (empiric)  Dincolo de aceste bariere este esenţial pentru viitorul domeniului aplicativ al psihologiei să se adopte pe scală largă modelul EBP din motivele expuse în cele ce urmează Includerea serviciilor psihologice în cadrul asistenţei complexe interdisciplinare În cele mai multe cazuri, problemele oamenilor sunt abordate interdisciplinar De exemplu, la ora actuală se tinde spre oferirea unor servicii integrate de sănătate (persoanele care au suferit un traumatism grav al membrului superior pot beneficia, pe lângă asistenţa medicală de specialitate, de servicii de kinetoterapie, precum şi de servicii psihologice pentru a facilita coping-ul adaptiv la noua situaţie şi pentru a identifica cele mai potrivite căi de reinserţie socioprofesională) În contextul în care profesiile din zona medicală au implementat deja modelul EBP, există o presiune suplimentară pentru practicienii din domeniul psihologiei de a-şi alinia soluţiile la aceeaşi paradigmă de lucru Acest lucru nu se întâmplă doar în zona serviciilor de sănătate (unde modelul EBP este cel mai avansat), ci începe să fie întâlnit şi în alte domenii de activitate (educaţie – EBP în pedagogie; asistenţă socială – EBP în asistenţă socială; management – EBP în management etc ) Astfel, EBP oferă un cadru comun de raportare, fiind un model pragmatic şi ateoretic, bazat pe identificarea celor mai potrivite soluţii validate ştiinţific pentru o problemă dată Eficientizarea serviciilor psihologice În mod curent (tradiţional), conform unor date din domeniul ştiinţelor medicale (apud Peterson, ), este necesar să treacă ani de la publicarea rezultatelor cercetărilor cu privire la eficienţa unei forme de intervenţie până la includerea acesteia, într-o măsură relativ extinsă, în practica curentă Această distanţă este necesară pentru că adesea informaţiile provenite din articole de specialitate nu sunt citite direct de către practicieni Aceştia din urmă preferă să îşi fundamenteze opiniile pe ceea ce cunosc deja din perioada facultăţii sau pe informaţii provenite din tratate fundamentale de specialitate, care sintetizează un domeniu anume Însă de cele mai multe ori este nevoie de timp pentru ca un concept sau o formă de intervenţie anume să treacă din zona articolelor ştiinţifice, tributare unui limbaj tehnic şi statistic uneori greu de descifrat, în zona unor recomandări concrete transmise studenţilor în formarea lor academică sau specialiştilor în formarea lor profesională continuă Prin abordarea EBP se solicită studiul aprofundat al literaturii de specialitate de ultimă oră (de exemplu, studii experimentale, metaanalize), iar acest aspect conduce la reducerea drastică a perioadei de timp necesară unei intervenţii pentru a intra în practica de zi cu zi Acest lucru le permite practicienilor adepţi ai EBP să aibă un avantaj în faţa colegilor lor, printr-un plus de eficienţă la nivelul rezultatelor obţinute, ca urmare a accesului la cele mai recente/solide descoperiri ştiinţifice de interes pentru domeniul lor de expertiză şi a fundamentării practicii lor pe soluţii dovedite a fi eficiente Accesul la fondurile publice Adaptând un slogan politic la modă, am putea spune că intervenţiile validate ştiinţific constituie o asigurare pentru contribuabil că taxele şi impozitele plătite către stat se regăsesc în accesul la servicii eficiente De altfel, discursul autorităţilor în această direcţie este acela că resursele limitate existente ar trebui alocate către acele intervenţii pentru care există dovezi validate ştiinţific că sunt eficiente, că produc efectele scontate Acesta este şi unul dintre motivele extinderii modelului EBP în domeniul sănătăţii, fiind facilitată de decizia autorităţilor din Marea Britanie, practică preluată apoi şi de alte state, de a aloca fonduri şi de a deconta servicii numai pentru acele intervenţii din sfera sănătăţii pentru care există dovezi ştiinţifice solide cu privire la utilitatea lor (Spring, ) De aceea, şansa psihologilor de a-şi deconta serviciile prestate din fonduri publice constă în demersul de a dovedi că dispun de intervenţii validate ştiinţific pentru problemele apărute Acest lucru este cu atât mai important cu cât aproape toate serviciile psihologice (educaţionale, clinice etc ), cu excepţia domeniului psihologiei muncii şi organizaţionale şi parţial a psihoterapiei (în unele state), sunt finanţate din fonduri publice Însă nu numai autorităţile de stat sunt interesate să se implementeze cele mai eficiente forme de intervenţie, ci şi alţi finanţatori De exemplu, companiile private de asigurări medicale din anumite ţări au stabilit că pot fi decontate servicii de psihologie dacă: (a) există dovezi empirice validate ştiinţific că intervenţia este una eficientă; (b) implementarea serviciului este una standard, pentru a permite asiguratorului să tragă la răspundere specialiştii care deviază nejustificat de la protocolul de implementare Informaţii şi resurse utile pentru practicienii care utilizează EBP Dacă ar fi să ne referim la cele trei braţe ale modelului EBP (figura ) vom constata adesea că practicienilor le este cel mai greu să intre în rolul de cercetător Atât din aceste considerente, cât şi pentru faptul că lucrarea de faţă are drept obiectiv specific cercetarea psihologică, vom prezenta în cele ce urmează o serie de informaţii şi resurse utile pentru practicieni Rolul acestora este de a facilita implementarea modelului EBP în practica profesională curentă Mai specific, vom urmări să oferim informaţii în legătură cu trei întrebări (aspecte) cheie din procesul EBP: (a) „ce surse de informare ar trebui accesate pentru a investiga care sunt intervenţiile validate ştiinţific pentru o anumită problemă psihologică?”; (b) „cât de valide sunt informaţiile respective/cât de mult ne putem încrede în ele?”; (c) „ce criterii ar trebui îndeplinite ca un serviciu psihologic să fie considerat ca fiind validat ştiinţific?” Surse de informare utile pentru practicieni În urma exploziei de informaţii din era tehnologică, unui specialist în psihologie îi este tot mai greu să parcurgă toate studiile de specialitate dintr-un anumit domeniu Pe lângă resursa de timp implicată, se poate pune şi problema costurilor, deoarece o parte însemnată din bazele de date relevante pentru psihologie sunt disponibile doar contra cost Luând în calcul motivele menţionate anterior, cel mai util pentru practicieni ar fi să caute dovezi privind nivelul de validare ştiinţifică în arhiva de studii Cochrane Collaboration ( ), utilă domeniilor din psihologie conexe ştiinţelor medicale (psihologie clinică, consiliere psihologică, psihoterapie), respectiv arhiva de studii Campbell Collaboration ( ), utilă pentru domenii ale psihologiei conexe ştiinţelor sociale (psihologia educaţională, psihologia juridică, psihologia comunitară, psihologia economică etc ) Recent, a fost gândită o asemenea bază de date şi în domeniul resurselor umane (psihologia muncii şi organizaţională), însă demersul se află abia la început, fiind greu de făcut predicţii cu privire la succesul acestei baze de date (SIOP/SHRM Collaboration, ) Spre deosebire de celelalte baze de date întâlnite în domeniul cercetării cum ar fi PsycInfo, ISI Web of Science etc , cele amintite mai sus sunt axate pe sinteze de studii cu nivel ridicat de validitate ştiinţifică (metaanalize de studii experimentale sau cvasiexperimentale; sinteze narative) şi au o arie de adresabilitate extinsă (inclusiv practicienii cu un nivel mai scăzut de expertiză ştiinţifică), prin includerea de rezumate scrise într-un limbaj netehnic De asemenea, accesul la consultarea sintezelor este liber (în regim gratuit) , oferind practicienilor o resursă serioasă spre consultare, în demersul de rezolvare a problemelor întâlnite în practica lor profesională O selecţie a tematicilor abordate în cele două baze de date de tradiţie (Cochrane şi Campbell) este prezentată în caseta Caseta Exemple de tematici abordate în cele două baze de date Exemple de sinteze disponibile în arhiva Cochrane Collaboration Intervenţii eficiente în comunicarea către adolescenţi şi copii a diagnosticului de cancer acordat unui alt membru al familiei Eficienţa programelor de prevenire a fumatului derulate în şcoală Eficienţa terapiei de cuplu în combaterea depresiei Eficienţa terapiei prin realitate virtuală la pacienţii care au suferit un atac vascular cerebral Intervenţii cognitiv-comportamentale pentru prevenirea aderării copiilor şi adolescenţilor la gangs (grupuri de tineri cu potenţial infracţional ridicat) Exemple de sinteze disponibile în arhiva Campbell Collaboration Strategii eficiente de managementul clasei de elevi pentru reducerea comportamentelor agresive şi de indisciplină ale elevilor Eficienţa programelor de training adresate părinţilor cu copii diagnosticaţi cu ADHD Efectul programelor de tip afterschool asupra elevilor Eficienţa intervenţiilor de prevenire a accidentelor de la locul de muncă Eficienţa programelor de prevenire a abuzului sexual Numărul de sinteze disponibile este impresionant, îndeosebi a celor existente în arhiva Cochrane Collaboration Cu toate că accesul la această arhivă din România este gratuit doar pentru rezumate, acestea sunt scrise într-un limbaj accesibil şi prezintă informaţii relevante care permit luarea unor decizii întemeiate pe studii validate ştiinţific Asemenea informaţii sunt incomparabil mai valoroase (mai valide ştiinţific), decât dacă ne-am raporta la opiniile prezentate în cadrul unor forumuri de specialitate sau la analiza unui singur studiu empiric de specialitate Caseta Una din cele aproximativ de sinteze disponibile în arhiva Cochrane Eficienţa usturoiului în tratarea răcelilor (Lissiman, Bhasale şi Cohen, ) La nivel popular, usturoiul este perceput ca un tratament eficient în prevenirea şi tratarea răcelilor, probabil datorită studiilor de laborator care au arătat că usturoiul are proprietăţi antivirale şi antibacteriene În analiză am căutat studii care să utilizeze usturoiul în prevenirea sau combaterea răcelii Au fost identificate cinci studii, însă numai unul (N = persoane) îndeplineşte criteriile pentru a fi inclus în analiză, fiind un studiu randomizat controlat Rezultate: cei care au consumat zilnic usturoi timp de trei luni de zile au avut un număr semnificativ statistic mai mic de răceli în comparaţie cu cei alocaţi în grupul placebo În cazul participanţilor care au răcit, nu au existat diferenţe semnificative cu privire la durata episodului de răceală ( , , respectiv , zile) Deşi rezultatul acestui studiu sprijină ideea rolului benefic al usturoiului în prevenirea apariţiei răcelilor, ar fi nevoie de mai multe studii randomizate pentru a replica rezultatele obţinute Posibilele efecte secundare în acest studiu se referă la miros şi la unele iritaţii ale pielii Studii suplimentare sunt necesare pentru a evidenţia clar efectele secundare în urma consumului de usturoi Desigur, chiar dacă în cele două baze de date cu tradiţie există un număr mare de sinteze este foarte posibil ca acestea să nu acopere toate posibilele probleme cu care se confruntă un practician O alternativă utilă în acest caz, dar cu aplicabilitate restrânsă doar la domeniul psihoterapiei, este consultarea listei de intervenţii validate ştiinţific Aceasta este actualizată periodic de un comitet din cadrul diviziei a Asociaţiei Psihologilor Americani Lista este disponibilă spre consultare accesând linkul asociat referinţei bibliografice menţionate (Chembless et al , ; ) În baza acestui demers, intervenţiile sunt grupate în două mari categorii: intervenţii validate ştiinţific, respectiv intervenţii cu probabilitate ridicată de a fi valide ştiinţific Totuşi, ar fi fost util să se introducă şi o a treia categorie, aceea a intervenţiilor despre care există dovezi că nu sunt valide ştiinţific În lipsa acestei categorii nu se poate distinge dacă intervenţiile care nu sunt menţionate în cele două categorii sunt omise pentru că nu există studii de validare (nu există date) sau pentru că există studii, dar acestea un arătat că terapia respectivă este ineficientă Un alt aspect important este faptul că împărţirea pe categorii se face în funcţie de problematica studiată, astfel încât este posibil ca aceeaşi formă de psihoterapie să fie eficientă pentru cazurile de bulimie, dar să nu fie inclusă în lista intervenţiilor validate ştiinţific sau a celor care au o probabilitate ridicată de a fi validate ştiinţific pentru intervenţii în cazuri de alcoolism O altă resursă avută la dispoziţie de către practicieni pentru a identifica intervenţii validate ştiinţific este apelul la baze de date internaţionale academice, precum PsycInfo, ERIC, PubMed etc , o parte dintre acestea fiind gratuite Dezavantajul apelării la aceste baze de date este faptul că, în cele mai multe cazuri, accesul gratuit este asigurat doar pentru studiul rezumatelor Un alt neajuns este limbajul extrem de tehnic întâlnit, ceea ce presupune cunoştinţe metodologice şi statistice avansate (vezi capitolele - ) În sfârşit, o altă sursă de informare utilă, mai ales pentru psihoterapeuţi şi psihologi clinicieni este apelul la ghiduri şi recomandări de derulare a activităţii profesionale pentru o tematică anume Din acest punct de vedere, recomandările NICE ( ) (acronim al organizaţiei britanice National Institute for Health and Clinical Excellence) evidenţiază nivelul de încredere (validare ştiinţifică) în diferitele practici necesare în tratamentul unei probleme (de exemplu, recomandări pentru tratarea tulburărilor de comportament alimentar), dar şi informaţii cu privire la raportul cost-eficienţă sau cost-utilitate al unei intervenţii care s-a dovedit a fi eficientă din punct de vedere clinic Informaţii utile pentru evaluarea calităţii ştiinţifice a dovezilor existente În concepţia publicului larg, dar din păcate şi a multor practicieni din domeniul psihologiei, cercetările conduc la adevăruri absolute, de necontestat De aceea, frecvent în discursul argumentativ al multor persoane se face apel la rezultatele unor cercetări ce sprijină punctul lor de vedere În realitate, lucrurile nu stau deloc aşa Orice studiu, oricât de bine ar fi fost întocmit, are o serie de limite De aceea este necesar să trecem prin filtrul gândirii critice rezultatele oricărui studiu Mai mult, studiile diferă la nivelul validităţii concluziilor extrase din ele, cu alte cuvinte au niveluri diferite de validare ştiinţifică Deşi au fost dezvoltate mai multe variante ale piramidei încrederii în dovezile empirice rezultate din studii (cea mai cunoscută fiind dezvoltată de Sackett et al , ), în cele ce urmează este prezentată o versiune proprie privind ierarhizarea dovezilor din perspectiva calităţii lor şi a nivelului de încredere avut în rezultatele studiului , Am ales această variantă pentru a integra informaţiile specifice legate de tipuri de cercetări, multe dintre ele fiind prezentate detaliat începând cu capitolul  Figura Piramida încrederii privind eficienţa unei intervenţii psihologice în funcţie de calitatea metodologică a studiilor pe care se bazează Cum se interpretează un asemenea grafic? În primul rând, orice consumator al literaturii de specialitate ar putea să înţeleagă faptul că nivelul de încredere în concluziile unui studiu este mai ridicat atunci când există dovezi ştiinţifice solide Dovezile sunt mai bune în cazul rezultatelor obţinute din studii aflate în partea superioară a piramidei (mai apropiate de vârful piramidei) Să luăm exemplul ipotetic a unui specialist din domeniul psihologiei educaţionale care, în baza experienţei acumulate (observaţii şi reflecţii personale), şi-ar forma opinia că stima de sine influenţează nivelul epuizării emoţionale a profesorilor (burnout), în sensul că un nivel scăzut al stimei de sine la profesori conduce la intensificarea simptomatologiei asociate stării de epuizare emoţională a acestora O asemenea opinie, dacă nu este sprijinită de date provenite din studii de specialitate rămâne la un nivel scăzut de încredere (nivelul – nivelul bazal din piramidă), lipsind dovezile care să o susţină Chiar dacă ar exista unele dovezi ştiinţifice, cum ar fi cazul unui studiu corelaţional (nivelul din piramidă – studii non-experimentale transversale), existenţa unei corelaţii negative semnificative statistic între stima de sine şi nivelul de burnout nu constituie o dovadă ştiinţifică suficientă pentru a afirma că stima de sine influenţează nivelul epuizării emoţionale, pentru că o asemenea afirmaţie specifică explicit existenţa unei relaţii de tip cauză-efect Se ştie însă că relaţia de cauzalitate este numai una dintre variantele care poate conduce la o asociere semnificativă între cele două variabile De exemplu, este posibil ca atât stima de sine scăzută, cât şi epuizarea emoţională, să fie amândouă consecinţe ale unui leadership autoritar din partea conducerii şcolii, orientat spre evidenţierea neregulilor corpului profesional (fără componenta feedbackului pozitiv) Acelaşi tip de relaţie poate fi pus pe seama altor variabile care ar putea juca un rol de tip cauză Astfel, nivelul scăzut de autoeficacitate didactică ar însemna o încredere scăzută a profesorului în capacitatea sa de a face faţă la provocările profesiei de dascăl Ar fi firesc, în aceste condiţii, ca acei profesori cu un nivel scăzut al autoeficacităţii didactice să manifeste niveluri mai scăzute ale stimei de sine şi un nivel mai ridicat de epuizare emoţională O altă ipoteză plauzibilă pentru a explica rezultatul semnificativ statistic obţinut în studiul corelaţional ar fi chiar una opusă, cu privire la direcţia relaţiei cauzale Astfel, nu ar fi de exclus ipoteza că epuizarea emoţională este sursa unui nivel mai scăzut al stimei de sine De pildă, într-un context economic marcat de criză, în care există o lipsă acută de locuri de muncă vacante este posibil ca cineva care manifestă un nivel ridicat de epuizare emoţională să-şi dorească să caute un alt loc de muncă, dar să aibă dificultăţi în găsirea unui alt loc mai bun Această stare de blocaj s-ar putea răsfrânge în timp asupra nivelului stimei de sine Pe scurt, toate aceste alternative explicative subliniază ideea că studiile corelaţionale pot valida doar afirmaţii ce indică ideea asocierii (există o corelaţie negativă între stima de sine şi nivelul epuizării emoţionale), însă nu pot conduce la afirmaţii valide cu privire la sursa (explicaţia) acestei asocieri etc Această situaţie se răsfrânge inclusiv la nivelul soluţiilor (intervenţiilor propuse) În lipsa unor dovezi ştiinţifice suficiente care să ateste relaţia de tip cauză-efect dintre stima de sine şi nivelul epuizării emoţionale este considerat inoportun să se implementeze un program de întărire a stimei de sine cu scopul de a reduce nivelul epuizării emoţionale Un pas suplimentar în discutarea relaţiilor de tip cauză-efect îl constituie studiile non-experimentale longitudinale (derulate pe o perioadă mai lungă de timp) În exemplul dat se poate institui drept criteriu de intrare măsurarea nivelului epuizării emoţionale la momentul iniţial (T ) Cei care obţin valori ridicate (ce indică prezenţa epuizării emoţionale) sunt excluşi din studiu Astfel, la începutul studiului, toţii participanţii sunt încadraţi în categoria celor care nu sunt epuizaţi emoţional Însă acest nivel al epuizării emoţionale este măsurat repetat, la diferite intervale de timp, şi se poate vedea astfel în ce măsură nivelul stimei de sine de la momentul anterior (de exemplu, T ) prezice dacă persoana este epuizată emoţional la următoarea testare (de exemplu, T ) sau mai ales în ce măsură modificări ale nivelului stimei de sine dintre momentele T şi T precedă modificări ale nivelului epuizării emoţionale între momentele T şi T Chiar dacă este vorba tot de un studiu non-experimental, designul longitudinal permite, între anumite limite importante, investigarea relaţiilor de tip cauză-efect, deoarece am putea examina dacă modificările privind epuizarea emoţională (efectul) sunt precedate de modificări ale nivelului stimei de sine (cauza potenţială) Acest lucru este posibil deoarece una dintre condiţiile demonstrării unei relaţii de tip cauză-efect este aceea ca modificările la nivelul variabilei cauză să preceadă modificările la nivelul variabilei efect O situaţie inversă, în care mai întâi ar apărea modificări la nivelul variabilei efect, ar fi o dovadă clară că relaţia cauză-efect propusă nu se susţine (nu este validată empiric) Însă, demonstrarea antecedenţei temporale a variabilei cauză faţă de variabila-efect, deşi este o condiţie necesară, ea nu este şi una suficientă pentru a demonstra existenţa unei relaţii de tip cauză-efect Revenind la exemplul dat, este posibil ca alte variabile străine să fie responsabile pentru variaţii ale nivelului epuizării emoţionale de la nivelul T la nivelul T De exemplu, pot exista şi alte variabile alternative (nivelul de autoeficacitate didactică, nivelul angajamentului organizaţional etc ) care să se modifice între momentele T şi T De asemenea, pot apărea unele evenimente importante între momentele testării care să fie responsabile pentru modificări la nivelul epuizării emoţionale De exemplu, deşi modificările de la momentul T la momentul T sunt precedate de modificări ale stimei de sine de la momentul T la nivelul T este posibil să apară un eveniment deosebit între momentele T şi T (cum ar fi o lege de diminuare a salariului pentru personalul bugetar cu %) care să fie cauza reală a modificărilor observate cu privire la epuizarea emoţională De aceea, studiile non-experimentale longitudinale, deşi constituie un pas suplimentar faţă de studiile non-experimentale transversale în privinţa dovezilor referitoare la o presupusă relaţie de tip cauză-efect, nu au acelaşi nivel de validitate privind detectarea unei relaţii de tip cauză-efect precum cel întâlnit în studiile experimentale, deoarece există un control redus asupra variabilelor străine care ar putea afecta concluziile studiului În schimb, dovezile obţinute din studiile experimentale sunt cele mai solide pentru a evidenţia o posibilă relaţie de tip cauză-efect deoarece, prin specificul lor, exercită cel mai bun control asupra variabilelor străine, care ar putea afecta concluziile unui studiu În capitolul sunt detaliate diferenţele dintre diferitele tipuri de studii experimentale sau cvasiexperimentale, precum şi limitele derivate din specificul fiecăruia, iar în capitolul sunt oferite detalii despre diferitele tipuri de studii non-experimentale O scurtă descriere a fiecărui tip de studiu inclus în piramidă (figura ) este prezentată în tabelul Excepţie face cazul opiniilor situate la baza piramidei, acestea nefiind studii efective, ci impresii subiective, formate în timp în baza unui amalgam de experienţe personale şi de informaţii disparate provenite din studii Tabelul Descrierea succintă a principalelor tipuri de studii de interes pentru practicienii adepţi ai abordării EBP Denumire Descriere succintă Observaţii  Studii de caz Analiza intensivă a unei unităţi (de exemplu, individ, grup, organizaţie) utilizate, fie cu scopul de a genera sau testa ipoteze (experimente pe un singur subiect), fie de a descrie (ilustra) impactul unei anumite teorii asupra unei situaţii particulare, contextuale (asupra unui individ) Detalii în David ( ), Vîrgă ( ) şi în secţiunea  Studii non-experimentale transversale Este cea mai întâlnită şi mai variată categorie de studii Acestea pot fi împărţite în studii descriptive şi în studii analitice (corelaţionale, comparative, metodologice) Toate au ca element comun faptul că datele sunt colectate în aceeaşi unitate de timp şi că nu există o manipulare a variabilelor din partea cercetătorului De aceea ele sunt cunoscute şi sub denumirea de studii observaţionale Detalii în capitolul , destinat studiilor non-experimentale  Studii non-experimentale longitudinale Este o categorie aparte de studii observaţionale, cu deosebirea că datele sunt colectate în baza unor măsurători repetate pe acelaşi lot de persoane, întinse pe o perioadă mai îndelungată de timp Fiind analizate aceleaşi persoane există un control mai bun asupra variabilelor străine decât în cazul studiilor transversale (sunt eliminate diferenţele interindividuale)   Metaanaliză pe studii non-experimentale Constă într-o analiză sistematică a studiilor anterioare de tip non-experimental Principalul scop al metaanalizei este de a sintetiza rezultatele obţinute într-un domeniu, atât pentru a reflecta situaţia globală (în cazul în care studiile incluse prezintă rezultate contradictorii), cât şi pentru a surprinde acele variabile moderatoare care prezic variaţii ale efectelor observate Deşi are avantajul cumulării studiilor, rezultatele obţinute rămân tributare limitelor studiilor non-experimentale incluse în analiză Detalii în capitolul , destinat studiilor metaanalitice  Studii cvasiexperimentale Acest gen de studii implică manipularea variabilei independente (VI) pentru a măsura impactul acesteia asupra variabilei dependente, însă grupurile comparate nu sunt formate prin alocarea randomizată a participanţilor, fapt care afectează calitatea controlului exercitat asupra variabilelor străine Detalii în capitolul , destinat studiilor experimentale şi celor cvasiexperimentale  Studii experimentale pragmatice Acestea îndeplinesc ambele cerinţe necesare pentru un studiu experimental: manipularea VI şi randomizarea participanţilor în grupele experimentale Totuşi, unele variabile pot influenţa rezultatele studiului, nefiind exercitat în mod deliberat un control strict asupra altor variabile pentru a vedea dacă efectul anticipat se manifestă în condiţiile naturale normale (de exemplu, criterii mai permisive de includere a participanţilor în studiu, importanţă scăzută acordată standardizării intervenţiei etc )   Studii experimentale cauzal-descriptive Acestea solicită un control strict al tuturor variabilelor care ar putea afecta concluziile studiului, fiind un design mai strict comparativ cu cel întâlnit în studiile pragmatice Pe de altă parte, doar pe baza acestui tip de design se poate dovedi clar existenţa unei relaţii de tip cauză-efect   Studii experimentale asupra mecanismelor schimbării Deşi este important să se demonstreze clar relaţia de tip cauză-efect (de exemplu, că terapia familial-sistemică este eficientă pentru a îmbunătăţi satisfacţia maritală), ar fi poate mai important să identificăm ce anume din cadrul intervenţiei a condus la creşterea satisfacţiei maritale, mai exact care au fost cauzele (mecanismele schimbării) Dacă se cunoaşte acest lucru pot fi optimizate ulterior intervenţiile pentru a maximiza efectul dorit   Metaanaliză pe studii experimentale Constă în analiza sistematică a studiilor anterioare de tip experimental (eventual şi a celor de tip cvasiexperimental) Rezultatele acestui tip de studii constituie cele mai solide dovezi ştiinţifice pentru că beneficiază atât de avantajele criteriului cantitativ (analiza mai multor studii), cât şi de cele ale criteriului calitativ (fiind incluse doar studii experimentale, acestea având cel mai scăzut risc de a conduce la concluzii distorsionate) Detalii în capitolul , destinat studiilor metaanalitice  Un alt mod de a ne raporta la piramida exprimată în figura este că, din punct de vedere cantitativ, cele mai multe dovezi provin din partea de jos a piramidei Din păcate, opiniile sunt cele mai frecvent întâlnite în practica de zi cu zi De regulă există mult mai multe opinii şi studii de tip non-experimental referitoare la o problemă decât există studii de tip experimental pe aceeaşi problematică De aceea, cu cât se urcă spre vârful piramidei există tot mai puţine studii disponibile Se pot detecta mai multe motive pentru această stare de fapt, dintre care două sunt cel mai frecvent întâlnite Primul motiv ar fi acela că studiile de tip experimental sunt studii care se fac pe probleme „mature”, adică asupra unor subiecte despre care există deja suficientă informaţie ştiinţifică provenită din studii non-experimentale Deoarece studiile experimentale necesită multe resurse logistice, nu ar fi normal, de exemplu, să se deruleze un studiu experimental care să urmărească efectul terapiei raţional emotive (REBT) asupra anxietăţii sociale, înainte de a exista dovezi că există o corelaţie între nivelul anxietăţii sociale şi nivelul cogniţiilor iraţionale (acestea fiind ţinta directă a modificărilor prin intermediul REBT) Cel de-al doilea motiv este de ordin etic Pentru a derula studii experimentale sau cvasiexperimentale este necesar să se realizeze o manipulare a variabilei independente de către cercetător, însă acest lucru nu este întotdeauna posibil din motive etice Astfel, nu ar fi acceptabil să facem un experiment cu privire la impactul abuzului emoţional exercitat asupra partenerului de cuplu asupra nivelului de depresie Ceea ce putem face în acest caz este să ne bazăm pe studii de tip non-experimental pentru că nu ar fi etic să împărţim randomizat participanţii în două grupe, una experimentală şi una de control, iar celor din grupa experimentală să le solicităm (să-i încurajăm) să manifeste comportamente abuzive din punct de vedere emoţional Pentru a complica şi mai mult lucrurile legate de nivelul de încredere în rezultatele diferitelor studii, se cuvine să precizăm că pot exista diferenţe calitative inclusiv între studiile aflate în aceeaşi categorie (pe aceeaşi treaptă) din piramidă De exemplu, în cazul studiilor randomizate de tip descriptiv-cauzal (efficacy studies) pot exista diferenţe, de exemplu, în funcţie de caracteristicile grupului de control Astfel, în general se acordă o mai mare încredere în rezultatele studiilor dacă grupul experimental este comparat cu un grup de control care primeşte un tratament de tip placebo , decât dacă grupul experimental este comparat cu un grup de control care momentan nu primeşte vreun tratament, fiind pe lista de aşteptare (waiting list) Acest lucru se întâmplă deoarece în primul caz putem distinge clar cât din efectul observat se datorează intervenţiei şi cât este doar efect placebo , pe când în cel de-al doilea caz nu este foarte clar dacă eventualele diferenţe observate sunt cauzate de intervenţia în sine sau de efectul placebo (vezi de asemenea efectul Hawthorne) De aceea, pentru a surprinde şi diferenţe calitative dintre studii, altele decât cele obţinute prin raportarea la piramida calităţii dovezilor ştiinţifice, au fost instituite unele grile de evaluare a calităţii dovezilor ştiinţifice care să includă şi alte criterii de analiză Una dintre cele mai răspândite grile de evaluare de acest gen este sistemul GRADE (Atkins et al , ; Balshem et al , ; Guyatt et al , ) care include, pe lângă (a) designul studiului ce se regăseşte şi în piramida calităţii dovezilor ştiinţifice, informaţii despre: (b) calitatea studiilor; (c) consistenţa rezultatelor; (d) similaritatea studiilor cu situaţia practică de rezolvat În baza datelor referitoare la design, la calitatea studiilor, la robusteţea şi omogenitatea efectelor şi la gradul de aplicabilitate a acestora la situaţia practică întâlnită, sistemul GRADE clasifică intervenţiile în patru categorii diferite, din perspectiva gradului de încredere că acestea vor funcţiona pentru situaţia practică întâlnită (caseta ) Caseta Principalele atribute ale sistemului GRADE (Balshem et al , ) Niveluri de încredere în reuşita intervenţiei (punctaj între paranteze): — ridicat ( ) – probabilitate scăzută ca studii viitoare să conducă la modificarea încrederii în eficienţa intervenţiei; — moderat ( ) – studii viitoare pot avea un impact relevant pentru concluziile referitoare la eficienţa intervenţiei; — scăzut ( ) – probabilitate ridicată ca studiile viitoare să aibă impact important asupra concluziilor, fiind posibil să asistăm la situaţia inversării direcţiei efectului; — foarte scăzut ( ) – orice direcţie a efectului este posibilă Scoruri de pornire iniţială: — dovezi obţinute în baza unor studii experimentale – ; — dovezi obţinute în baza unor studii non-experimentale (observaţionale) sau cvasiexperimentale – ; — dovezi bazate pe opinii – Aceste punctaje sunt ajustate după cum urmează: Scăderi de punctaj — – sau – puncte pentru calitatea scăzută a studiilor sub standardul implicat de designul respectiv; — – pentru număr mic de studii sau pentru cazul în care se observă efecte eterogene (variaţii mari); — – sau – puncte penalizare pentru studiile care au puţine similitudini cu grupul-ţintă vizat în practică; — – pentru situaţii de prezentare trunchiată a rezultatelor (reporting bias) Creşteri de punctaj — + dacă variabilele străine necontrolate ar fi putut afecta datele doar în direcţia reducerii efectului; — + dacă este manipulată VI (studii cvasiexperimentale); — + sau + dacă există asocieri puternice între variabile (risc relativ dublu, Cohen d cu aproximaţie de , ), respectiv foarte puternice (risc relativ de ori mai mare/mai mic, Cohen d aproximativ , ) Avantajul utilizării GRADE este acela că, în anumite cazuri, informaţii poziţionate inferior pe scala calităţii dovezilor din perspectiva designului pot fi considerate mai utile decât cele situate pe poziţii superioare Un astfel de exemplu, ar fi cazul comparării a două forme de psihoterapie A şi B pentru combaterea depresiei majore la vârstnici Intervenţia A este considerată mai potrivită de utilizat (dacă ea se bazează pe eficienţa observată în două studii de tip cvasiexperimental, ambele efectuate pe o populaţie similară ca vârstă şi din punct de vedere cultural şi în condiţiile în care se observă efecte omogene şi robuste), decât terapia B (pentru care există dovezi privind eficienţa acesteia într-un studiu experimental pragmatic, dar efectuat pe o populaţie diferită, de exemplu, pe tineri delincvenţi) Utilizarea sistemului GRADE, deşi nu specifică explicit ce înseamnă o intervenţie validată ştiinţific, constituie un reper util pentru practicieni, fiind indicat să se apeleze doar la intervenţii catalogate ca având un nivel de încredere ridicat sau unul moderat Dovezi ştiinţifice minimale pentru a considera o intervenţie drept validată ştiinţific În urma căutării informaţiilor relevante din literatura de specialitate şi a analizei critice privind calitatea şi relevanţa lor pentru problema investigată, se cuvine să precizăm nişte standarde (benchmarks) pentru a considera o anumită intervenţie din domeniul psihologiei, ca fiind validată ştiinţific Asociaţia Psihologilor Americani (APA), prin divizia de Psihologie Clinică şi Psihoterapie (vezi Chambless et al , , sau Chambless şi Hollon, ) propune asemenea repere pentru segmentul de intervenţii terapeutice Conform acestei propuneri, există două categorii acceptabile de intervenţii terapeutice validate ştiinţific: intervenţii a căror eficienţă este clar demonstrată, respectiv intervenţii probabil eficiente Aceste repere constituie o poziţie oficială pentru domeniul psihoterapiei, fiind la baza alcătuirii listei de intervenţii validate ştiinţific realizată şi actualizată periodic de către specialiştii APA Caseta Criterii minimale pentru intervenţiile validate ştiinţific Intervenţii eficiente (well-established treatment): cel puţin două studii experimentale de tip cauzal-descriptiv (efficacy studies) în care să fie demonstrată eficienţa intervenţiei în unul sau mai multe dintre următoarele moduri: a) intervenţia este superioară unei intervenţii psihologice de tip placebo sau unei alte intervenţii psihoterapeutice sau din zona farmacoterapiei; b) intervenţia este echivalentă unei alte intervenţii psihoterapeutice a cărei validitate a fost demonstrată anterior, în cadrul unor studii care au o putere statistică adecvată (de exemplu, cel puţin de persoane per grup experimental); sau un număr mare (n â‰Ą ) de experimente pe un singur participant (single-case experiments) în care s-a constatat că intervenţia este una eficientă, utilizând un design experimental adecvat şi respectând criteriul a Condiţii suplimentare solicitate atât pentru cazul , cât şi pentru cazul : intervenţiile să fie implementate în baza unui manual (să fie standardizate); criteriile de includere (excludere) a participanţilor în studiu să fie explicitate, astfel încât să fie clare caracteristicile participanţilor; eficienţa intervenţiei să fie demonstrată de cel puţin doi cercetători diferiţi (echipe de cercetare diferite) Intervenţii probabil eficiente: două studii experimentale în care se demonstrează că intervenţia este eficientă comparativ cu un grup de control tip listă de aşteptare (care nu beneficiază momentan de niciun fel de intervenţie); sau un studiu experimental care îndeplineşte criteriile , şi menţionate în categoria intervenţiilor eficiente; sau un număr mai redus de experimente pe un singur subiect (n â‰Ą ) derulate cu respectarea criteriilor , şi menţionate în categoria intervenţiilor eficiente Notă: Evaluarea se face separat pentru fiecare tip de problemă în parte Spre exemplu, unele intervenţii pot fi considerate eficiente pentru tratarea depresiei majore, pot fi probabil eficiente pentru tratarea anxietăţii sociale şi pot fi chiar ineficiente (sau pot lipsi dovezi suficiente legate de eficienţa lor) pentru tratarea atacurilor de panică De-a lungul timpului au fost dezvoltate mai multe asemenea criterii minimale (vezi lista lor în Chambless şi Ollendick, sau în Kratochwill şi Stoiber, ) La acestea aş adăuga contribuţia recentă adusă de profesorul clujean Daniel David împreună cu cercetătorul american Guy Montgomery Aceştia propun o altă grilă pentru încadrarea intervenţiilor în categoria celor validate ştiinţific, punând accent nu numai pe eficienţa unei intervenţii anume, ci şi pe existenţa unor dovezi privind mecanismele cauzale responsabile pentru această schimbare (David şi Montgomery, ) Cei doi autori au pornit în demersul lor de la: (a) problema existenţei multiplelor cadre de referinţă existente pentru a încadra o intervenţie ca fiind validată ştiinţific, ceea ce conduce la situaţia neplăcută ca anumite intervenţii psihoterapeutice să fie considerate validate ştiinţific după anumite criterii, dar nu şi după altele şi (b) problema accentului excesiv pus pe eficienţa intervenţiei cu neglijarea cadrului teoretic În consecinţă, cei doi autori propun să se diferenţieze între intervenţiile psihoterapeutice nu numai în funcţie de eficienţa lor, ci şi în funcţie de fundamentarea ştiinţifică a teoriei de la baza lor Astfel, David şi Montgomery ( ) propun un sistem de evaluare format din nouă clase (categorii) de intervenţii psihoterapeutice rezultate din intersectarea a două criterii majore, fiecare cu câte trei niveluri de raportare Cele două criterii sunt: eficienţa terapeutică ( – efecte benefice; – rezultate neclare/contradictorii/nedovedite; – efecte absente/adverse); respectiv fundamentarea teoretică a intervenţiei (mecanismele cauzale implicate) ( – dovezi clare; – dovezi inconcludente/contradictorii/absenţa testării; – dovezi care contrazic clar modelul teoretic/teorii pseudoştiinţifice, ce nu pot fi infirmate) Cele nouă categorii sunt prezentate în figura Dintre acestea, cinci categorii (clase) sunt considerate ca fiind invalide din punct de vedere ştiinţific pentru că, fie există dovezi privind lipsa lor de eficienţă terapeutică, fie se bazează pe teorii invalidate, fie au ambele neajunsuri menţionate (cum ar fi cazul intervenţiilor incluse în clasa ) Se consideră că există dovezi despre o anumită tehnică dacă există rezultate similare obţinute din cel puţin două studii experimentale efectuate de cercetători sau echipe de cercetare diferite Desigur, ideal pentru orice intervenţie terapeutică ar fi să ajungă să fie încadrată în prima clasă, aceea a intervenţiilor pentru care există dovezi, atât cu privire la eficienţa lor, cât şi cu privire la cauzele (teoria) pentru care acestea sunt eficiente, prin identificarea mecanismelor schimbării Pentru ca eficienţa să fie demonstrată este nevoie ca dovezile să provină din cel puţin două studii experimentale, efectuate de cercetători sau echipe de cercetare diferite De remarcat, de asemenea, că orice intervenţie nouă (cu excepţia cazului când este fundamentată pe teorii invalidate ştiinţific sau pe modele pseudoştiinţifice), este încadrată pentru început în clasa , destinată intervenţiilor pentru care încă nu există suficiente dovezi privind eficienţa lor şi mecanismele cauzale implicate, dar care se bazează pe modele teoretice generale pentru care există suport ştiinţific Mecanism cauzal susţinut Informaţii insuficiente Mecanism cauzal respins/imposibil de testat  Eficienţă demonstrată Clasa Clasa Clasa  Rezultate contradictorii, eterogene/lipsă informaţii Clasa Clasa Clasa  Eficienţă absentă/efecte adverse prezente Clasa Clasa Clasa  Figura Clasificarea intervenţiilor după David şi Montgomery ( ), adaptare Deşi cele mai multe demersuri de evaluare a intervenţiilor aparţin domeniul psihologiei clinice şi psihoterapiei, trebuie menţionat că demersuri similare au fost efectuate şi în alte domenii aplicative ale psihologiei De exemplu, Diviza a APA a propus un sistem de lucru pentru stabilirea eficienţei intervenţiilor din domeniul psihologiei şcolare (Kratochwill şi Stoiber, ) Acesta este probabil cel mai comprehensiv sistem de evaluare (de exemplu, manualul de codare are nu mai puţin de de pagini – pentru detalii, vezi Kratochwill, ), însă tocmai din cauza acestei complexităţi sporite este puţin probabil să fie adoptat în practica profesională În schimb, sistemul este foarte util pentru cercetătorii interesaţi să stabilească nivelul de validare ştiinţifică pentru diferitele intervenţii din domeniul educaţional şi pentru practicienii interesaţi de a avea o imagine de ansamblu (în scop educaţional) cu privire la detaliile implicate într-o abordare de tip practician-cercetător (scientist-practitioner) Acest model complex cuprinde, pe lângă caracteristicile precizate pentru aria psihologiei clinice (accentul pus pe evaluarea eficienţei unei intervenţii din perspectiva validităţii interne a studiilor), atât criterii ce ţin de validitatea externă a rezultatelor (similaritate culturală, de vârstă etc ), cât şi aspecte ce vizează validitatea de construct şi validitatea statistică a studiilor (detalii despre tipurile de validitate sunt prezentate în capitolul următor) O altă caracteristică specifică este includerea în procesul de evaluare a intervenţiilor în sprijinul cărora datele provin din studii calitative Ca modalitate de punctare, fiecare aspect este evaluat utilizând un sistem de codare în patru puncte ( – dovezi puternice; – dovezi promiţătoare; – dovezi limitate [slabe]; – absenţa dovezilor) De exemplu, în evaluarea calităţii studiilor cu referire la grupele de control utilizate se acordă: puncte pentru grupuri de control active formate prin randomizare (intervenţii alternative, placebo etc ); puncte pentru grupuri de control pasive formate prin randomizare (listă de aşteptare); punct pentru grupuri de control formate fără randomizare (studii cvasiexperimentale), dar în care există demonstrată echivalenţa cu grupul experimental la nivel de pretest pentru variabilele de interes sau măcar există niveluri similare procentuale cu referire la retragerea din experiment şi puncte pentru situaţia absenţei unui grup de control sau pentru cazul unor grupuri de control pentru care nu s-a făcut niciun efort de asigurare a echivalenţei lor cu grupul experimental La ora actuală nu am cunoştinţă de existenţa vreunui demers de clasificare a intervenţiilor în zona psihologiei muncii şi organizaţională, însă principiile menţionate pentru cazurile psihoterapiei sau psihologiei şcolare pot fi extrapolate de către practicienii interesaţi şi pentru analiza intervenţiilor din domeniul organizaţional În schimb au fost formulate sugestii de clasificare a procesului de evaluare psihologică (toate celelalte clasificări menţionate referindu-se la partea de intervenţie psihologică) (Cohen et al , ) Criteriile de bază în zona evaluării psihologice, aşa cum era de aşteptat, vizează în principal caracteristicile psihometrice ale metodei de evaluare (cel mai adesea un test psihologic) Caseta Criterii utilizate pentru evaluarea instrumentelor psihologice din perspectiva EBP Metode solide (well-established assessment) Instrumentul este prezentat în cel puţin două articole de specialitate cu peer-review, de către doi cercetători sau două echipe de cercetare diferite Sunt prezentate detaliat informaţii psihometrice care să ateste că metoda de evaluare are o bună validitate şi fidelitate în cel puţin un articol cu peer-review La cerere sunt oferite informaţii suplimentare (există un manual) care să prezinte alte informaţii relevante, încât să permită o evaluare critică a rezultatelor şi implementarea standard a metodei Metode probabil eficiente Instrumentul este prezentat în cel puţin două articole de specialitate cu peer-review, de către acelaşi autor sau aceeaşi echipă de cercetare Sunt prezentate detaliat informaţii psihometrice care să ateste că metoda de evaluare are o validitate şi o fidelitate acceptabilă în cel puţin un articol cu peer-review La cerere sunt oferite informaţii suplimentare (există un manual) care să prezinte alte informaţii relevante, încât să permită o evaluare critică a rezultatelor şi implementarea standard a metodei Metode promiţătoare Instrumentul este prezentat într-un singur articol de specialitate cu peer-review Caracteristicile psihometrice associate metodei sunt bune sau cel puţin adecvate La cerere sunt oferite informaţii suplimentare (există un manual) care să prezinte alte informaţii relevante, încât să permită o evaluare critică a rezultatelor şi implementarea standard a metodei O clasificare oarecum similară a fost adoptată de Colegiul Psihologilor din România (Liţă, Stan şi Sava, ), conform căreia se acordă: (a) aviz pe perioadă nedeterminată (metode solide) acordat probelor care dovedesc existenţa unui manual, dovezi numeroase şi robuste privind caracteristicile psihometrice (validitate şi fidelitate), precum şi dovada adaptării pe populaţie românească, inclusiv etaloane, dacă este cazul; (b) sau aviz pe perioadă determinată (metode probabil eficiente/promiţătoare) acordat probelor care dovedesc existenţa unui manual, prezintă dovezi suficiente privind validitatea testului şi acceptabile cu privire la fidelitate şi etalonare şi dovezi de adaptare pe populaţie românească, dacă este cazul Probele care nu îndeplinesc aceste criterii minimale sunt respinse de la avizare O listă a probelor psihologice avizate de către Comisia de Metodologie a Colegiului Psihologilor din România (CPR) este disponibilă la www copsi ro Din păcate nu au fost demarate asemenea demersuri de către alte comisii aplicative ale CPR pentru a identifica intervenţiile validate ştiinţific din diferite domenii de activitate, deşi acest lucru ar fi putut fi făcut, cel puţin în domeniul psihologiei clinice, a consilierii psihologice şi a psihoterapiei unde există multă literatură specifică Sugestii suplimentare privind luarea deciziei în practica EBP La finalul acestui proces laborios pe care ar trebui să-l parcurgă un practician adept al practicii EBP apare problema selectării celei mai bune soluţii de implementat în practică Să ne reamintim că în EBP trebuie să se ţină seama, pe lângă identificarea unor intervenţii validate ştiinţific, şi de caracteristicile clientului, precum şi de nivelul de expertiză (existenţa competenţei necesare) a psihologului în a implementa soluţia cea mai bună La aceasta se adaugă resursele existente, fiind preferate soluţiile care dovedesc că sunt eficiente şi fezabile de implementat, dar şi care posedă un foarte bun raport cost-eficienţă Deşi decizia în sine ţine de o abordare contextuală, ideografică, ar fi util ca orice practician să răspundă la o serie de întrebări (vezi tabelul , o adaptare după modelul sugerat de Kratochwill şi Shernoff, ), pentru a alege cea mai potrivită intervenţie pentru contextul respectiv Tabelul Zece întrebări-cheie (filtru) în selectarea intervenţiilor psihologice Dimensiuni vizate Soluţia Soluţia Soluţia   Clientul are caracteristici similare cu cele întâlnite în soluţiile identificate ca fiind validate ştiinţific? Caracteristici demografice – vârstă, sex, nivel de educaţie, spaţiu cultural Solicitantul intervenţiei – clientul, părintele, angajatorul etc      Cât de complexă este intervenţia (de reproductibilă)? Specifică – replicabilă uşor; complexă – reuşita ei depinde de mulţi factori      Există factori contextuali (organizaţionali) care pot interfera cu privire la reuşita intervenţiei? Climat instituţional şi politici organizaţionale, sprijinul conducerii, percepţia beneficiarilor faţă de soluţia propusă      Există expertiza necesară pentru implementarea soluţiei? Certificări necesare, experienţă anterioară      Există acces la un manual sau măcar la un ghid de implementare a intervenţiei?      Poate fi încadrată intervenţia în categoria celor validate ştiinţific?      Există dovezi solide privind eficienţa intervenţiei propuse? Efecte omogene şi robuste (semnificative din punct de vedere clinic, practic)      Intervenţia constituie un factor de risc pentru apariţia unor efecte secundare adverse (pot fi afectate alte aspecte importante pentru client)?      Există indicatori obiectivi (operaţionalizabili) care să monitorizeze eficienţa intervenţiei, înainte de finalizarea ei?      Intervenţia prezintă un bun raport cost-eficienţă?     De asemenea, în contextul decizional implicat, practicianul ar trebui să fie atent să nu se lase influenţat de distorsiunile cognitive inerente situaţiilor de decizie şi de evaluare (monitorizare) a procesului de implementare Printre cele mai frecvente se regăsesc: euristica de accesibilitate (indiferent de natura problemei alegem soluţia la îndemână, care a fost utilizată şi cu alte ocazii sau cea în care avem cea mai mare experienţă – „de ce nu încerci X, am obţinut multe rezultate bune”); euristica exemplului-clişeu (conturarea unui profil stereotipal – „vă cunosc eu pe voi «ăştia», copiii străzii, la toţi funcţionează metoda X”); biasul confirmării (amintirea situaţiilor care se pliază pe teoria implicită construită despre problema clientului, cu scop asigurator că lucrurile sunt pe o direcţie bună); apelul la explicaţii post hoc (justificări aduse unor situaţii apărute – „metoda funcţionează mai puţin eficient acum decât în alte ocazii pentru că au apărut unele circumstanţe agravante”) În sfârşit, acolo unde este posibil ar trebui ca în implementarea intervenţiei selectate să se ţină cont de recomandările existente în ghidurile de intervenţie (în cazul în care sunt elaborate asemenea documente) Aceasta este dovada finală care distinge la nivel aplicativ între diferitele domenii de activitate O ştiinţă matură ar trebui să se bazeze pe protocoale specifice de intervenţie şi mai puţin pe impresii personale şi opinii despre cum ar trebui să fie implementată o anumită intervenţie De altfel, în medicină acest aspect face de multe ori diferenţa dintre praxis şi malpraxis şi este posibil ca, odată cu dezvoltarea mai multor ghiduri şi protocoale de intervenţie, să se ajungă la aceeaşi stare de fapt şi în psihologie Concluzii Conceptul practicii validate ştiinţific (EBP) cunoaşte în ultimii ani o dezvoltare deosebită, fiind introdus treptat în domenii aplicative variate (management, ştiinţele educaţiei, politici publice, psihologie, ştiinţe medicale) Ideea de bază este de a identifica şi implementa în practica de zi cu zi acele intervenţii care s-au dovedit a fi validate ştiinţific Acceptarea acestora şi încrederea pe care o avem în eficienţa lor este dependentă de calitatea dovezilor ştiinţifice existente, în baza studiilor empirice realizate Din acest punct de vedere, standardul spre care se tinde este acela de a obţine dovezi din studii randomizate (experimentale) şi, îndeosebi, din metaanalize care sintetizează rezultatele acestor studii experimentale EBP înseamnă mai mult decât intervenţii validate ştiinţific Implică, de asemenea, a ţine cont de expertiza clinică a celui care implementează soluţia şi de caracteristicile specifice ale clientului căruia i se propune intervenţia respectivă Astfel, pe lângă dimensiunea ce vizează eficienţa intervenţiei, la fel de relevantă este şi dimensiunea ce vizează utilitatea aplicativă (în sfera sănătăţii se foloseşte denumirea de utilitate clinică) Aceasta se referă la discutarea fezabilităţii, aplicabilităţii şi a utilităţii (mărimea efectului) unei intervenţii validate ştiinţific, vizând astfel aspecte ce ţin de validitatea externă Adoptarea unui asemenea model profesionist din partea practicienilor, în ciuda unor inconvenienţe (necesită resurse de timp şi un efort mai mare), va conduce la multiple beneficii pentru profesia de psiholog prin: (a) o mai mare responsabilizare în legătură cu actul profesional prin respectarea unor protocoale de intervenţie; (b) o creştere a calităţii serviciilor psihologice prin obţinerea de efecte pozitive mai intense în urma implementării celor mai potrivite tehnici de intervenţie şi prin eliminarea, în timp, a practicilor demodate care s-au dovedit a fi ineficiente; (c) dezvoltarea pregătirii profesionale a psihologilor prin apariţia de materiale educaţionale şi comerciale diverse (manuale de intervenţie, casete video etc ) şi dezvoltarea psihologiei ca ştiinţă, prin creşterea nivelului de alfabetism ştiinţific printre practicieni, ca o măsură suplimentară menită să reducă discursul de tip pseudoştiinţific din domeniul psihologiei Lecturi suplimentare Rob B Briner şi Danise M Rousseau ( ) Evidence-based I-O psychology; Not there yet Industrial and Organizational Psychology, , pp - Articolul prezintă starea de fapt cu privire la situaţia practicii validate ştiinţific în domeniul psihologiei muncii şi organizaţională Bonnie Spring ( ) Evidence-based practice in clinical psychology: What it is, why it matters, what you need to know Journal of Clinical Psychology, , pp - Articolul are marea calitate de a prezenta într-o manieră foarte structurată aspectele-cheie ale conceptului de EBP (istoric, definire, resurse) cu referire la domeniul psihologiei clinice şi al psihoterapiei Cochrane Collaboration – www cochrane org Bază de date gratuită, al cărei scop este de a colecta şi evalua toate studiile randomizate din zona sănătăţii cu scopul de a-i ajuta pe practicieni şi pe cei care dezvoltă politici în domeniul sănătăţii să ia deciziile cele mai bune La ora actuală sunt înregistrate peste de evaluări De interes îndeosebi pentru următoarele direcţii aplicative ale psihologiei: psihologie clinică, consiliere psihologică şi psihoterapie Campbell Collaboration – www campbellcollaboration org Baza de date este inspirată după modelul de succes al Cochrane Collaboration, cu scopul de a colecta şi evalua toate studiile de tip experimental sau cvasiexperimental din domenii variate ale ştiinţelor sociale Este vorba de intervenţii aplicate în domenii precum educaţie, asistenţă socială, politici publice, justiţie şi criminalitate La ora actuală există peste de sinteze realizate De interes îndeosebi pentru direcţiile aplicative: psihologie şcolară, psihologie comunitară, psihologie juridică, psihologie economică, psihologie socială aplicată Bibliografie APA ( ) Society for Clinical Psychology American Psychological Association Division Disponibilă la adresa http://www div org/PsychologicalTreatments/faq html APA Presidential Task Force on Evidence-Based Practice ( ) Evidence-based practice in psychology American Psychologist, , pp - Atkins, D , Best, D , Briss, P A , Eccles, M , Falck-Ytter, Y , Flottorp, S , Guyatt, G H et al ( ) Grading quality of evidence and strength of recommendations British Medical Journal, ( ), p Balshem, H , Helfand, M , Schunemann, H J , Oxman, A D , Kunz, R , Brozek, J , Vist, G E et al ( ) GRADE guidelines : rating the quality of evidence – introduction Journal of Clinical Epidemiology, , pp - Bennett, S , Tooth, L , McKenna, K , Rodger, S , Strong, J , Ziviani, J et al ( ) Perceptions of evidence-based practice: a survey of Australian occupational therapists Australian Occupational Therapy Journal, , pp - Bîrle, D ( ) Implicaţii psihologice ale alegerii carierei Teză de doctorat, Universitatea „Babeş-Bolyai”, Cluj-Napoca Briner, R B , Rousseau, D M ( ) Evidence-based I-O psychology: Not there yet Industrial and Organizational Psychology, , pp - Campbell Collaboration ( ) The Campbell Collaboration What helps? What harms? Based on what evidence Disponibil la adresa: http://www campbellcollaboration org Chambless, D L , Baker, M J , Baucom, D H , Beutler, L E , Calhoun, K S , Crits-Christoph, P , Daiuto, A et al ( ) Update on empirically validated therapies, II Clinical Psychologist, , pp - Chambless, D L , Hollon, S D ( ) Defining empirically supported therapies Journal of Consulting and Clinical Psychology, , pp - Chambless, D L , Ollendick, T H ( ) Empirically supported psychological interventions: Controversies and evidence Annual Review of Psychology, , pp - Chambless, D L , Sanderson, W C , Shoham, V , Bennett Johnson, S , Pope, K S , Crits-Christoph, P , Baker, M et al ( ) An update on empirically validated therapies Clinical Psychologist, , pp - Cochrane Collaboration ( ) The Cochrane Collaboration Working together to provide best evidence for health care Disponibil la adresa: http://www cochrane org Cohen, L L , La Greca, A M , Blount, R L , Kazak, A E , Holmbeck, G N , Lemanek, K L ( ) Introduction to special issue: Evidence-based assessment in pediatric psychology Journal of pediatric psychology, , pp - Craig, J V , Smyth, R L ( ) The evidence-based practice manual for nurses New York: Elsevier Health Sciences David, D ( ) Metodologia cercetării clinice Iaşi: Editura Polirom David, D , Montgomery, G H ( ) The scientific status of psychotherapies: A new evaluative framework for evidence-based psychosocial interventions Clinical Psychology: Science and Practice, , pp - Gaudiano, B A , Statler, M A ( ) The scientist practitioner gap and graduate education: Integrating perspectives and looking forward The Clinical Psychologist, , pp - Gibbs, L ( ) Evidence-based practice for the helping professions Belmont, CA: Wadsworth Publishing, Thomson Higher Education Guyatt, G , Oxman, A D , Akl, E , Kunz, R , Vist, G , Brozek, J , Norris, S et al ( ) GRADE guidelines Introduction-GRADE evidence profiles and summary of findings tables Journal of Clinical Epidemiology, , pp - Humphris, D , Littlejohns, P , Victor, C , O’Halloran, P , Peacock, J ( ) Implementing evidence based practice: factors that influence the use of research evidence by occupational therapists British Journal of Occupational Therapy, , pp - Ig, R , Kwan, I ( ) School-based driver education for the prevention of traffic crashes The Cochrane Library, , disponibil la adresa: http://www thecochranelibrary com Kratochwill, T R ( ) Task force on evidence-based interventions in school psychology Procedural and coding manual for review of evidence-based interventions Disponibil la adresa: http://www indiana edu/~ebi/EBI-Manual pdf Kratochwill, T R , Shernoff, E S ( ) Evidence-based practice: promoting evidence-based interventions in school psychology School Psychology Review, , pp - Kratochwill, T R , Stoiber, K C ( ) Evidence-based interventions in school psychology: Conceptual foundations of the Procedural and Coding Manual of Division and the Society for the Study of School Psychology Task Force School Psychology Quarterly, , pp - Ledford Jr, G E , Heneman III, H G ( ) Skill-based pay The SIOP/SHRM Library, disponibil la adresa: http://www siop org/siop-shrm/default aspx Levant, R F , Hasan, N T ( ) Evidence-based practice in psychology Professional Psychology: Research and Practice, , pp - Lissiman, E , Bhasale, A L , Cohen, M ( ) Garlic for the common cold The Cochrane Library, disponibil la adresa: http://www thecochranelibrary com Liţă, S , Stan, A , Sava, F A ( ) The development and use of Romanian system for reviewing and certification of psychological tests Lucrare prezentată la cel de-al XXIX-lea Congres Internaţional de Psihologie, Iulie - , Berlin, Germania NICE ( ) National Institute for Health and Clinical Excellence Disponibil la adresa: http://www nice org uk Noonan, E ( ) Evidence-based pedagogy The Campbell Library, disponibil la adresa: http://www campbellcollaboration org Norcross, J C , Beutler, L E , Levant, R F (eds ) ( ) Evidence-based practices in mental health: Debate and dialogue on the fundamental questions APA, Washington, DC Overholser, J C ( ) Ten criteria to qualify as a scientist-practitioner in clinical psychology: An immodest proposal for objective standards Journal of Contemporary Psychotherapy, , pp - Peterson, K ( ) Practice-based primary care research-translating research into practice through advanced technology Family Practice, , pp - Petrosino, A , Turpin-Petrosino, C , Buehler, J ( ) „Scared straight” and other juvenile awareness programmes for preventing juvenile delinquency The Cochrane Library, disponibil la adresa: http://www thecochranelibrary com Rousseau, D M ( ) Is there such a thing as evidence-based management? Academy of Management Review, , pp - Rynes, S L , Giluk, T L , Brown, K G ( ) The very separate worlds of academic and practitioner periodicals in human resource management: Implications for evidence-based management Academy of Management Journal, , pp - Sackett, D L , Rosenberg, W M C , Gray, J A M , Haynes, R B , Richardson, W S ( ) Evidence based medicine: What it is and what it isn’t British Medical Journal, , pp - Sackett, D L , Strauss, S E , Richardson, W S , Rosenberg, W , Haynes, R B ( ) Evidence-based medicine: How to practice and teach EBM (ediţia a II-a) New York: Churchill Livingstone Schneider, B , Barbera, K M ( ) Driving customer satisfaction through HR: creating and maintaining a service climate The SIOP/SHRM Library, disponibil la adresa: http://www siop org/siop-shrm/default aspx Seligman, M E P ( ) The effectiveness of psychotherapy The consumer reports study American Psychologist, , pp - Shernoff, E S , Kratochwill, T R , Stoiber, K C ( ) Training in evidence-based interventions (EBIs): What are school psychology programs teaching? Journal of School Psychology, , pp - SIOP ( ) Principles for the validation and use of personnel selection procedures (ediţia a IV-a) Disponibil la adresa: http://www siop org/ Principles/principles pdf SIOP/SHRM Collaboration ( ) SIOP and SHRM: promoting evidence-based HR Disponibil la adresa http://www siop org/siop-shrm/default aspx Spring, B ( ) Evidence-based practice in clinical psychology: What it is, why it matters, what you need to know Social Science Research, , pp - Stricker, G ( ) Are science and practice commensurable? American Psychologist, , pp - Vîrgă, D ( ) Psihologie experimentală – de la teorie la practică Timişoara: Editura Universităţii de Vest Wikipedia ( ) List of academic databases and search engines Disponibil la adresa: http://en wikipedia org/wiki/List of academic databases and search engines Wilson, J L , Armoutliev, E , Yakunina, E , Werth, J L ( ) Practicing psychologists’ reflections on evidence-based practice in psychology Professional Psychology: Research and Practice, , pp - Wilson, S J , Tanner-Smith, E E , Lipsey, M W , Steinka-Fry, K , Morrison, J ( ) Dropout prevention and intervention programs: Effects on school completion and dropout among school-aged children and youth The Campbell Library, disponibil la adresa: http://www campbellcollaboration org O altă traducere, ce va fi utilizată alternativ pentru EBP, este aceea de practică bazată pe dovezi empirice În acest sens ar merita analizate în contrast normativele practicii EBP cu situaţia întâlnită în multe cabinete de psihologia muncii şi transporturilor din România Din nefericire, în cele mai multe cazuri, deciziile de acordare a avizului psihologic (apt/inapt) au fost luate în baza unor metodologii lipsite complet de orice validare ştiinţifică (cu instrumente psihologice depăşite şi/sau cu proprietăţi psihometrice discutabile; în absenţa studiilor de validare a eficienţei procesului de testare etc ) Aceste neajunsuri au condus în desuetudine practica din cabinetele de profil şi a contribuit, alături de alţi factori politici, la amendarea legii din la finalul anului , soldată cu eliminarea obligativităţii examinării psihologice periodice în cele mai multe situaţii Accesul este gratuit la sintezele din Campbell Collaboration, respectiv din SIOP/SHRM Collaboration, atât pentru rezumate, cât şi pentru rapoartele integrale Accesul la sintezele din Cochrane Collaboration este gratuit numai pentru rezumate Pentru rapoartele integrale accesul se face contra cost cu unele excepţii (gratuitate pentru utilizatorii din UK sau în baza unor donaţii) Din punct de vedere istoric, arhiva Cochrane Collaboration a fost iniţiată în anul , în UK (denumirea fiind dată în cinstea lui Archie Cochrane [medic], care a fost primul cercetător care a atras atenţia la începutul anilor ‘ asupra unei probleme extinse, aceea de a utiliza în practică intervenţii despre care nu se ştie nimic cu privire la nivelul lor de eficienţă – cât de benefice sunt acestea) Arhiva Campbell Collaboration a fost demarată mai târziu, în anul , denumirea fiind dată în cinstea psihologului Donald Campbell care a avut contribuţii importante metodologice, în special în identificarea distorsiunilor care pot afecta concluziile studiilor, îndeosebi a celor de tip cvasiexperimental Totuşi, în lipsa accesului la rapoarte în format integral, în cazul Cochrane Collaboration este dificil să se răspundă din perspectiva EBP la întrebarea legată de aplicabilitate (vezi tabelul ) Ideea unei liste de servicii avizate pe baza nivelului lor de validitate ştiinţifică a fost preluată de către Comisia Metodologică a Colegiului Psihologilor din România cu referire la avizarea testelor (www copsi ro) Astfel, unele teste au primit aviz pe perioadă nedeterminată (cele cu nivelul cel mai ridicat de dovezi privind existenţa unor proprietăţi psihometrice solide), iar altele au primit un aviz pe perioadă determinată (cele cu dovezi minimal acceptabile din perspectivă psihometrică) Desigur, există şi varianta unui aviz nefavorabil (pentru probele psihologice care nu îndeplinesc nici măcar criteriile minimale) Din păcate, lista oficială prezintă doar probele din primele două categorii, astfel că nu este clar dacă o probă a fost omisă din listă pentru că a fost respinsă sau pentru că nu a fost supusă procesului de evaluare Pentru o listă extinsă a bazelor de date internaţionale existente şi a domeniului principal de aplicabilitate recomand consultarea Wikipedia ( ) În domeniul psihologiei organizaţionale există mult mai puţine resurse de acest gen (vezi, spre exemplu, ghidul dezvoltat pe tema selecţiei de personal – SIOP, ) De altfel, SIOP (Society of Industrial and Organizational Psychology) este principalul promotor al modelului EBP în domeniul psihologiei muncii şi organizaţională În această direcţie, începând cu sub egida SIOP, împreună cu SHRM (Society for Human Resources Management), au început să fie publicate sinteze utile pentru practicieni pe baza informaţiilor validate ştiinţific (vezi sintezele realizate de Ledford Jr şi Heneman III, ; Schneider şi Barbera, ) Totuşi, aceste sinteze au o structură apropiată mai degrabă de evaluările narative decât de cele sistematice Acest demers de colaborare poartă denumirea în limba engleză de SIOP/SHRM Collaborative Series şi are drept scop promovarea modelului bazat pe dovezi empirice valide ştiinţific în domeniul resurselor umane Se au în vedere aspecte care ţin de validitatea internă Desigur, pot fi generate şi alte tipuri de piramide care să aibă în vedere alte tipuri de validitate, cum ar fi validitatea externă În astfel de situaţii, sondajele de opinie sau panelurile efectuate pe un eşantion reprezentativ de persoane ar ocupa locurile dinspre vârful piramidei, chiar dacă ar fi studii de tip non-experimental Din cauza eterogenităţii ridicate a calităţii designurilor studiilor cuprinse într-o metaanaliză de studii experimentale, există tendinţa întâlnită în domeniul medical de a plasa în topul încrederii rezultatele obţinute în cadrul unui studiu randomizat controlat extins (large-scale randomized trials) (David, comunicare personală, aprilie ) Acest tip de studiu experimental are trei caracteristici de bază: (a) implementarea se face prin cooperarea unor echipe de cercetare independente, în locaţii independente; (b) se realizează pe un volum impresionant de participanţi (de obicei N > ) şi (c) respectă un nivel ridicat de exigenţă din perspectivă metodologică Având în vedere aceste caracteristici tehnice şi a resurselor uriaşe pe care le implică, acest gen de design este, după cunoştinţele mele, deocamdată absent din domeniul psihologiei În psihologie, prin tratament placebo se înţelege o intervenţie aparent similară cu cea din grupul experimental, dar care nu urmăreşte să modifice variabila dependentă de interes, efectul intervenţiei placebo fiind localizat asupra unui aspect nerelaţionat cu variabila dependentă În cazul efectului placebo, ideal ar fi ca participanţii la studiu să nu poată distinge clar ce intervenţie au urmat Iată un exemplu de intervenţie placebo (Bîrle, ) într-un studiu de testare a eficienţei unui program de training menit să îmbunătăţească capacitatea de decizie privind cariera şcolară la elevii aflaţi în an terminal de liceu: atât participanţii din grupul experimental, cât şi cei din grupul placebo au urmat sesiuni de training a câte de minute fiecare Ceea ce a diferit a fost conţinutul predat În cazul celor din grupul placebo, acesta nu avea legătură directă cu abilitatea de a lua decizii privind cariera, fiind predate informaţii cu caracter general despre comunicare şi rezolvarea de conflicte În opinia mea, sistemul GRADE este cel mai apropiat de realitatea practicienilor, atât prin simplitate, cât şi prin faptul că ţine seama de aspecte importante pentru practica de zi cu zi, cum ar fi analiza similarităţii dintre situaţia de rezolvat (caracteristicile clientului) şi cele ale cercetărilor în care au fost obţinute rezultatele Seligman ( ) identifică cinci limite majore inerente studiilor experimentale descriptiv-cauzale (efficacy) prin raportare la practica cotidiană: (a) experimentele au o durată standard limitată spre deosebire de practică unde durata şi intensitatea programului de intervenţie variază; (b) practicienii pot interveni pe parcursul derulării intervenţiei corectând sau modificând unele aspecte gândite iniţial, în timp ce în experimentele de acest tip terapeuţii urmează strict recomandările din manualul de intervenţie; (c) în realitate clienţii îşi aleg de multe ori forma de psihoterapie urmată în baza preferinţelor personale, iar această motivaţie, absentă în studiile bazate pe randomizarea participanţilor, poate augmenta efectul obţinut; (d) în practică cei mai mulţi clienţi au multiple comorbidităţii (mai multe tulburări), în timp ce în experimentele de tip efficacy sunt excluşi asemenea indivizi; (e) în practică este relevantă funcţionarea per ansamblu a individului, în timp ce în experimentele menţionate relevantă este eficienţa intervenţiei asupra variabilei dependente ţintă (primary outcome) În domeniul organizaţional au fost efectuate foarte puţine studii experimentale (randomizate), deoarece majoritatea intervenţiilor au fost implementate şi finanţate direct de către beneficiar (adesea organizaţii orientate spre profit) Din acest motiv cele mai multe studii din zona testării eficienţei unei intervenţii sunt de tip cvasiexperimental Prin urmare, raportarea ar trebui să ţină seama de acest specific Capitolul Strategii de cercetare în psihologie Scopul principal al acestui capitol este acela de oferi cititorilor o grilă pragmatică de lectură a aspectelor ce ţin de metodologia cercetării, pe care le consider esenţiale pentru dezvoltarea unei priviri de ansamblu despre activitatea de cercetare din domeniul psihologiei Prin urmare, în acest capitol nu ne vom opri asupra fundamentelor activităţii ştiinţifice, asupra noţiunilor de epistemologie sau asupra tradiţiilor şi curentelor de abordare din filosofia ştiinţei şi din logică Cei interesaţi de aceste aspecte conceptuale bazale pot găsi informaţii relevante în primele două capitole din David ( ) În schimb, scopul acestui capitol este acela de a contribui la dezvoltarea gândirii critice şi a spiritului analitic, atunci când se planifică un studiu psihologic, respectiv atunci când se analizează critic rezultatele provenite din cercetări realizate de alţii Pentru a atinge acest deziderat, am împărţit capitolul de faţă în şase secţiuni aparent eterogene, din combinarea cărora sperăm să oferim cititorilor interesaţi acea grilă de lectură critică utilă şi o viziune de ansamblu asupra demersului de cercetare Accentul este pus pe metodologia de cercetare de tip cantitativ, aceasta fiind perspectiva dominantă la ora actuală în psihologie False dileme în cercetarea psihologică Activitatea de cercetare presupune o serie de decizii din partea celui care o efectuează, fiecare dintre acestea având un impact important asupra rezultatului final obţinut Între aceste decizii de luat se regăsesc şi o serie de false dileme sau afirmaţii Pe cele mai răspândite dintre acestea, întâlnite în cei peste ani de activitate în zona psihologiei academice, le vom prezenta în continuare Metode de cercetare cantitative vs metode de cercetare calitative în psihologie Pe de o parte, am întâlnit colegi care susţin cu tărie că cea mai potrivită modalitate de a accesa nivelul de profunzime al psihicului este prin metode calitative de cercetare, deoarece metodele cantitative tratează la un nivel superficial fenomenele psihice Am sesizat că această poziţie nefavorabilă metodologiei cantitative este îmbrăţişată îndeosebi de cei care manifestă o nesiguranţă în stăpânirea aparatului metodologic şi/sau statistic, ceea ce mă face să cred că rolul acestor credinţe este unul defensiv, acţionând ca un veritabil mecanism de apărare Pe de altă parte, am întâlnit colegi de breaslă care încercau să dezlipească de sens orice demers de cercetare psihologică, înlocuindu-l cu un şir lung de cifre (rezultate statistice), desprinse de semnificaţia lor teoretică/psihologică Pentru aceştia, cercetarea de tip calitativ are doar un rol secundar, acela de a oferi date congruente pentru a confirma sau ilustra rezultatele cantitative obţinute Din punctul meu de vedere, o asemenea dilemă, cantitativ vs calitativ, este una falsă, deoarece problema superiorităţii unei forme sau alta de cercetare nu se poate pune în termeni abstracţi, ci numai în legătură cu un anumit obiectiv de studiat Aşadar, problema pusă în termeni corecţi ar fi aceea de a stabili care dintre cele două forme de metodologie este mai potrivită pentru un anumit obiectiv de cercetare vizat De pildă, cercetarea calitativă pare a fi mai potrivită atunci când obiectivul studiului vizează înţelegerea unor fenomene din perspectiva actorului, descriind realitatea aşa cum este ea percepută de către participanţi, pornind de la premisa că este mai important ceea ce percep oamenii ca fiind realitate, decât realitatea observabilă însăşi (Kvale apud Gilbert şi Irons, ) În schimb, metodologia de tip cantitativ este mai potrivită atunci când obiectivul studiului este de a stabili existenţa unei relaţii de tip cauză-efect, cum ar fi identificarea măsurii în care o anumită formă de psihoterapie este eficientă în combaterea atacurilor de panică O cercetare este cu atât mai valoroasă cu cât analizele statistice sunt mai complexe Aparent, apelul la metode statistice sofisticate, cum ar fi modelarea prin ecuaţii structurale, apelul la regresii logistice sau analiza de clustere, oferă o prestanţă superioară oricărui demers ştiinţific Într-o anumită măsură, o asemenea concluzie este sprijinită de multitudinea şi complexitatea relaţiilor dintre diverse fenomene Realitatea poate fi surprinsă mai bine prin tehnici statistice multivariate decât prin cele aparţinând statisticii uni- sau bivariate În esenţă, însă, calitatea ridicată a unei cercetări este determinată îndeosebi de problema investigată şi de noutatea (importanţa) teoretică sau aplicativă a subiectului studiat A apela la ecuaţii structurale pentru a demonstra lucruri arhicunoscute (de exemplu, că inteligenţa şi motivaţia şcolară, chiar surprinse ca variabile latente, prezic performanţa şcolară a elevilor) reprezintă un demers ştiinţific desuet, chiar dacă corect din punct de vedere statistic De asemenea, apelul la tehnici statistice complexe pentru a compara empiric modele care nu au nicio relevanţă aplicativă sau nicio fundamentare teoretică reprezintă o altă tendinţă care trebuie descurajată În consecinţă, o prelucrare statistică de excepţie, deşi necesară, nu ţine locul unei cercetări de o calitate superioară Ceea ce contează, în primul rând, este importanţa problemei investigate şi adecvarea metodologiei de cercetare (design, metode de cercetare şi de analiză a datelor) la obiectivul propus al studiului O cercetare este mai valoroasă dacă îşi propune să investigheze mai multe aspecte Gândirea de tipul „mai mult este mai bine” am regăsit-o destul de frecvent, mai ales în rândul studenţilor, atunci când aceştia îşi puneau problema în studiile lor, dacă trei ipoteze sau patru probe psihologice utilizate sunt suficiente, dacă două obiective ajung etc Desigur, asemenea dileme constituie un indiciu potrivit pentru a detecta lipsa abilităţii de a face cercetare, prin neînţelegerea aspectului central situat la baza activităţii de cercetare Astfel, orice demers de cercetare trebuie să se raporteze în permanenţă la întrebarea supusă investigării (obiectivul cercetării) Numai prin raportare la acest aspect esenţial se pot formula adecvat ipoteze de cercetare şi se pot stabili corect aspecte specifice, precum tipul de design al cercetării, numărul de instrumente necesare (variabile de operaţionalizat) etc În consecinţă, numărul de obiective, de ipoteze, de instrumente utilizate nu este relevant în sine, ci se stabileşte în funcţie de aspectele investigate în cercetarea respectivă Pot exista cercetări cu un singur obiectiv şi o singură ipoteză principală de investigat, mult mai valoroase din punct de vedere teoretic sau aplicativ decât cercetări care investighează simultan mai multe aspecte redundante/arhicunoscute (cum ar fi asocierea dintre nivelul de anxietate şi cel de neuroticism) sau irelevante pentru obiectivul studiului (cum ar fi diferenţa dintre băieţi şi fete cu privire la numărul de ore de vizionare zilnică la TV într-un studiu care urmăreşte să stabilească dacă există o asociere între stilul parental autoritar şi comportamentul prosocial al copiilor) La nivelul studiilor doctorale în psihologie, cercetarea derulată trebuie să propună ceva original, care să revoluţioneze domeniul de interes al tezei Ideea că ştiinţa progresează prin experimente unice, cruciale este o percepţie predominant greşită, determinată mai degrabă de titlurile din mass-media şi de absenţa unei culturi ştiinţifice, inclusiv în rândul multor absolvenţi de studii superioare Fără a nega posibilitatea unor asemenea excepţii, cel mai frecvent cunoaşterea progresează gradual prin contribuţii limitate la problematica investigată Deoarece unul dintre cele mai importante mesaje ale acestei lucrări este că nicio cercetare nu este perfectă din perspectiva validităţii concluziilor rezultate (vezi detalii în secţiunea a acestui capitol), este important ca orice demers investigativ să fie conectat la cele anterioare şi să încerce să rezolve o necunoscută pe care studiile anterioare fie nu au abordat-o, fie nu au reuşit să o rezolve în mod concludent Cu alte cuvinte, un demers respectabil pentru orice teză de doctorat, respectiv pentru orice lucrare de cercetare în genere, este acela de a conduce unul sau mai multe studii care să elimine unele dintre neajunsurile sesizate în cercetările anterioare efectuate pe tematica respectivă Desigur, acest demers trebuie însoţit de sublinierea impactului teoretic şi/sau aplicativ al studiilor propuse Pentru a ilustra acest principiu al progresului gradual în cunoaştere, citiţi conţinutul casetei din capitolul următor (capitolul ), în care sunt prezentate o serie de studii succesive cu privire la relaţia cauzală dintre dispoziţia afectivă pozitivă şi nivelul de altruism Probleme stringente în cercetarea psihologică din România Dacă aspectele amintite anterior reprezintă false probleme cu care se confruntă mulţi consumatori sau producători de cercetare din România, voi aminti în cele ce urmează patru probleme importante care pot impieta dezvoltarea sănătoasă a cercetării în psihologie din ţară Cultura ştiinţifică deficitară Există cercetări bune şi cercetări cu rezultate distorsionate Din nefericire însă, am constatat că o bună parte dintre studenţii sau absolvenţii de psihologie nu pot distinge corect între diferitele tipuri de designuri de cercetare (experimental, cvasiexperimental sau non-experimental), fiindu-le cu atât mai greu să facă diferenţe între cercetări aparţinând aceleiaşi clase de design din perspectiva riscurilor existente în cazul validităţii concluziilor studiului În lipsa acestei competenţe tehnice, ei tind să acorde credit informaţiilor prezentate în studiile respective, indiferent de gradul acestora de acoperire În spatele acestui credit stă premisa uneori eronată că studiile prezintă adevăruri valide, de vreme ce ele au fost publicate şi sunt efectuate de către personalităţi din domeniul academic sau de formatori de şcoli psihoterapeutice etc Însă nu toate studiile ajung să fie publicate în reviste prestigioase, fundamentate pe un proces de evaluare colegială foarte exigent O parte semnificativă din studii ajung să fie publicate în reviste cu o politică editorială mai puţin riguroasă, aspect decelat cu dificultate de către nespecialişti Acest segment de consumatori de literatură academică, posesor al unei culturi metodologice deficitare, este cel mai predispus să cadă în capcanele abordărilor pseudoştiinţifice reliefate pe larg în primul capitol al cărţii, cum ar fi îndeosebi extinderea fără temei a concluziilor, distorsiunea de confirmare, inversarea demersului de validare ştiinţifică ş a m d Probleme etice în derularea studiilor şi analiza rezultatelor Spre deosebire de situaţia existentă în statele occidentale, aspectele etice relaţionate activităţii de cercetare psihologică din România rămân în multe cazuri abordate doar la un nivel teoretic La această stare de fapt contribuie deopotrivă absenţa unei instanţe din multe universităţi care să evalueze specific studiile de cercetare propuse încă din stadiul de proiect, cât şi lipsa unei cutume din partea cercetătorilor de a utiliza formulare de consimţire informată atunci când îşi derulează cercetările pe diferite categorii de participanţi O problemă la fel de gravă, întâlnită atât în rândul practicienilor psihologi, dar şi în unele medii studenţeşti, este aceea a utilizării de instrumente psihologice fără a avea drept de utilizare (cu încălcarea drepturilor de autor asupra acestora) Nu în ultimul rând, o altă problemă de natură etică, adesea tratată cu tăcere, este aceea a falsificării/fabricării rezultatelor sau a utilizării selective a datelor provenite din analizele statistice efectuate (ignorate fiind cele care nu sprijină ipotezele formulate şi/sau rezultatele nesemnificative statistic) O discuţie elaborată asupra acestei teme este prezentată în capitolul , secţiunea Pentru moment ne vom rezuma doar să amintim cele trei mari fraude existente: (a) fabricarea datelor; (b) falsificarea datelor; şi (c) plagiatul pentru care există sancţiuni drastice care pot merge până la retragerea titlurilor ştiinţifice sau profesionale dobândite Restul aspectelor constituie abateri de la buna conduită care trebuie corectate de autor atunci când sunt semnalate Probleme metodologice I: inadaptarea literaturii de specialitate la obiectivele studiului O afirmaţie dură, dar din nefericire nu foarte îndepărtată de adevăr, este aceea că, în foarte multe cazuri, ceea ce apare în secţiunile introductive ale unor articole publicate în reviste româneşti de specialitate poate fi inclus în categoria „maculatură” Adesea, secţiunile introductive se apropie de ideea unor referate despre conceptele uzitate în lucrare De exemplu, într-un studiu care vizează rolul predictiv al inteligenţei generale asupra performanţei în muncă a unui lot de cadre didactice mi-a fost dat să văd că nu se discută direct problema abordată („ce anume nu e clar asupra acestei relaţii din literatura anterioară?”, „de ce ar fi important să studiem această problemă?”, respectiv „ce şi cum anume va reuşi studiul nostru să rezolve o parte din necunoscutele semnalate?”) În schimb este posibil să întâlnim un întreg pomelnic despre istoricul evoluţiei conceptului de inteligenţă (de la Galton şi Binet până în prezent), să găsim o prezentare detaliată a conceptului de măsurare a performanţei în muncă şi a tipologiilor asociate existente, plus, eventual, un scurt sumar necritic al studiilor care au abordat relaţia dintre inteligenţă şi performanţa profesională Cititorii interesaţi să-şi îmbunătăţească abilitatea de a redacta secţiunile introductive ale articolelor lor de specialitate au la dispoziţie un ghid prescriptiv pe această problematică în secţiunea (capitolul ) Probleme metodologice II: inadaptarea metodologiei cercetării la obiectivele studiului O altă problemă întâlnită destul de frecvent constă în utilizarea unui design de cercetare inadecvat pentru a răspunde specificului întrebărilor din studiu Astfel, am întâlnit studii ce conţineau afirmaţii care sprijină existenţa unor relaţii de tip cauză-efect, deşi designul utilizat nu le permitea acest lucru, fiind vorba de studii corelaţionale În mod similar, am sesizat situaţii în care se ofereau explicaţii (era postulat un anumit mecanism cauzal) în studii al căror design experimental nu permitea identificarea unor mecanisme ale schimbării etc Concluziile rezultate din asemenea studii conţin afirmaţii hazardate, ce nu se susţin din cauza lipsei controlului adecvat asupra factorilor de risc ce pun în pericol validitatea studiilor respective În restul capitolului de faţă, accentul este pus pe reducerea acestui tip specific de erori, astfel încât să fie clar ce tip de studii şi ce fel de design metodologic aferent este mai potrivit pentru a răspunde la o anumită problemă de cercetat În acest sens vom trece, mai întâi, în revistă tipurile majore de cercetare şi impactul lor asupra întrebărilor de cercetare care pot fi adresate Tipuri de cercetări şi relevanţa lor pentru procesul cunoaşterii Prin cercetare în sens larg se înţelege o activitate care produce cunoaştere Cercetarea ştiinţifică este un anumit tip de cercetare, deosebită de cea filosofică sau de cea teologică prin metodologia utilizată pentru a ajunge la „adevăr”, la acele cunoştinţe necesare rezolvării unor probleme (David, ) Din acest punct de vedere, al impactului pe care îl are în cunoaştere şi al sferei de problematici ce pot fi rezolvate, cercetarea ştiinţifică poate fi clasificată ca: (a) cercetare fundamentală; (b) cercetare aplicată; (c) cercetare pentru dezvoltare şi inovare În cadrul psihologiei şi a ştiinţelor sociale în general, cercetarea aspectelor psihice poate accentua fie realitatea observabilă, dată (independentă de credinţele celui evaluat), fie realitatea construită de subiectul cercetării (semnificaţia şi interpretarea realităţii construite de către subiect) În primul caz vorbim de (a) o paradigmă realistă, pozitivistă de abordare a psihologiei, iar în cel de-al doilea despre (b) o paradigmă constructivistă (hermeneutică sau fenomenologică) Luând în calcul caracteristicile metodologiei de cercetare utilizate, cercetarea ştiinţifică poate apela la: (a) metodologii calitative sau la (b) metodologii cantitative Tot din punct de vedere metodologic, luând în calcul gradul de control al variabilelor confundate vorbim despre: (a) studii experimentale; (b) studii cvasiexperimentale şi (c) studii non-experimentale În sfârşit, după obiectivul pe care îl poate avea un studiu şi pornind de la rolul cunoaşterii ştiinţifice de a descrie, prezice şi explica fenomene psihice, putem împărţi cercetările ştiinţifice în: (a) cercetări exploratorii; (b) cercetări descriptiv-analitice; (c) cercetări cauzale Această ultimă categorie poate fi la rândul ei divizată în cercetări cauzal-descriptive şi cercetări cauzal-explicative În cele ce urmează vom oferi o serie de informaţii suplimentare despre fiecare tip de clasificare, accentuând acele aspecte care evidenţiază tipul de întrebări de cercetare la care se poate răspunde printr-un anumit tip de cercetare În acest demers, ne vom focaliza îndeosebi pe ultima dintre clasificări, deoarece aceasta adresează direct problematica selectării celui mai potrivit tip de design de cercetare în funcţie de întrebarea cercetării (obiectivul studiului) Cercetare fundamentală vs cercetare aplicată vs cercetare pentru dezvoltare-inovare La originea distincţiei dintre cele trei forme de cercetare se află conflictul dintre modelul cartezian de a vedea ştiinţa (rolul fundamental al ştiinţei este de a cunoaşte şi înţelege lumea) şi modelul lui Francis Bacon (rolul ştiinţei este de a ameliora bunăstarea oamenilor, utilitatea descoperirilor plasându-se înaintea cunoaşterii în sine) (Bevan, apud Kantowitz, Roediger III şi Elmes, ) Dacă ar fi să ne raportăm la cazul specific al psihologiei, cercetarea fundamentală se încadrează în primul model de cunoaştere, fiind interesată îndeosebi să găsească explicaţii pentru modul de funcţionare a psihicului uman (de exemplu, „cum poţi reduce un comportament indezirabil, în general?”), în timp ce cercetarea aplicată şi cea orientată spre dezvoltare-inovare se centrează asupra măsurii în care anumite cunoştinţe rezultate din cercetarea fundamentală pot fi aplicate în contexte specifice pentru a rezolva probleme concrete sau pentru a veni în sprijinul unor nevoi pe care le au oamenii (de exemplu, „cum poţi să modifici comportamentul copiilor care suferă de enurezis, în direcţia reducerii acestor comportamente?”) Din punct de vedere pedagogic, cele două tipuri majore de cercetare, fundamentală vs aplicată, se diferenţiază prin: (a) gradul de generalizare a rezultatelor obţinute (transferabilitate ridicată în cercetarea fundamentală vs transferabilitate limitată în cercetarea aplicativă) ; (b) prin gradul de utilitate a rezultatelor obţinute (utilitate practică imediată absentă/redusă – cercetarea fundamentală; utilitate practică imediată ridicată – cercetarea aplicativă); (c) accentul pe aspecte teoretice în dauna practicii (accent pe aspecte teoretice, pe cunoştinţe declarative în cercetarea fundamentală; accent pe implicaţii practice, pe cunoştinţe procedurale în cercetarea aplicativă) În realitate, distincţia dintre ele este mai degrabă una teoretică, deoarece cel mai adesea relaţia dintre ele este sub forma unui continuum care are la un capăt cercetarea fundamentală, iar la celălalt capăt cercetarea aplicativă Pentru a ilustra această idee, voi apela la un exemplu din psihologia socială Dacă obiectivul studiului este acela de a evidenţia caracteristicile procesărilor cognitive stereotipice cu referire la outgrup ne aflăm mai degrabă pe teritoriul cercetării fundamentale Dacă ne propunem să oferim soluţii care să reducă conflictele interetnice prin reducerea stereotipurilor negative cu referire la membrii unui outgrup ne deplasăm pe acel continuum dinspre cercetarea fundamentală spre cea aplicată În sfârşit, dacă ne propunem să studiem efectul unei intervenţii de reducere a stereotipurilor negative faţă de rromi (bazându-ne pe informaţiile oferite de cercetările anterioare menţionate) ne aflăm în zona cercetării aplicate Din cadrul cercetării aplicate se desprinde un tip aparte de studii, constituite sub denumirea generică de cercetare pentru dezvoltare şi inovare Aceasta apare atunci când cercetarea aplicată atinge acel nivel care-i permite să răspundă direct nevoilor unor clienţi prin oferirea de servicii, produse sau tehnologii inovative solicitate de către aceştia Cel mai adesea, produsul final în asemenea cazuri nu se materializează prin publicaţii ştiinţifice, ca în cazul cercetării fundamentale sau aplicate, ci prin brevete şi/sau prototipuri tehnologice În sfârşit, o idee importantă este aceea că cele trei forme de cercetare nu diferă din perspectiva metodologiei cercetării uzitate În toate cele trei cazuri putem găsi deopotrivă studii experimentale sau corelaţionale, studii cantitative sau calitative Totuşi, în cercetarea fundamentală se observă un accent ridicat pus pe studiile de tip experimental, îndeosebi spre acele studii cauzal-explicative (vezi secţiunea ) ce permit oferirea de explicaţii pentru relaţiile de tip cauză-efect constatate Cercetări în paradigma pozitivistă vs paradigma interpretativă Pe lângă importanţa şi utilitatea practică a problemei cercetate, o amprentă importantă asupra cercetării derulate o are perspectiva filosofică din care este abordată tema respectivă Ştiinţe naturale vs ştiinţe umaniste; etic vs emic; pozitivism vs hermeneutică (interpretivism); nometetic vs ideografic; cantitativ vs calitativ; naturalism vs relativism; dat vs construcţie; psihologia hard şi psihologia soft etc reprezintă diferite terminologii utilizate pentru a sublinia o distincţie importantă existentă în cercetarea psihologică Pe de o parte se află cercetătorii susţinători ai paradigmei pozitiviste Conform acestora, cunoaşterea ştiinţifică rezultă din aplicarea metodologiei ştiinţifice pentru a testa teoriile (adesea subiective) formulate Astfel, se accentuează ideea studiului riguros al comportamentului uman, pornind de la premisa că fenomenele psihice, la fel ca şi relaţiile sociale funcţionează în baza unor legităţi care trebuie descoperite, asemenea legilor (de exemplu, gravitaţia) din ştiinţele naturale Prin urmare, accentul în această perspectivă cade asupra determinării suportului empiric existent pentru afirmaţiile făcute (de exemplu, surprinderii unei relaţii cauzale) şi pe controlul/eliminarea aspectelor introspective, subiective, considerate a pune în pericol validitatea studiilor În această paradigmă, aspectele subiective nu sunt de interes decât din perspectiva măsurilor de control, în vederea eliminării riscului ca asemenea aspecte subiective să afecteze (distorsioneze) cunoaşterea fenomenelor studiate Pe de altă parte se află cercetătorii susţinători ai ideii că important pentru domeniul ştiinţelor sociale (psihologia fiind inclusă formal printre acestea) este să se studieze mai degrabă valorile, simbolurile, credinţele personale şi normele sociale, toate acestea accentuând construcţiile psihologice, perspectiva social istorică, subiectivă asupra lucrurilor, ţinându-se cont de contextul cercetării şi de dinamica interacţiunii dintre cercetător şi participanţi În acest caz, accentul nu cade pe surprinderea unor relaţii deterministe, cauzale, specifice, ci pe surprinderea intenţiilor, a întregului, a modului în care participanţii interpretează şi înţeleg ceea ce trăiesc din punct de vedere psihologic, dar şi a influenţei pe care mediile social, istoric şi politic le au asupra acestor construcţii De asemenea, în abordarea interpretativă, aprecierea calităţii unei cercetări se face apelând la criterii diferite faţă de abordarea pozitivistă În această abordare, demersul ştiinţific urmăreşte surprinderea nivelului de împărtăşire al unor opinii/trăiri între participanţi cu privire la problematica investigată, cu interpretarea semnificaţiei acestora în gradiente diferite, în funcţie de paradigma dominantă de abordare (constructivistă, fenomenologică, hermeneutică, feministă, etnografică etc sau a unei combinaţii dintre acestea) De exemplu, în paradigma fenomenologiei hermeneutice, accentul este pus pe găsirea unor semnificaţii (interpretarea) evenimentelor trăite, luând în calcul inclusiv detalii care pot oferi insighturi despre fenomenul analizat Pentru a face acest lucru cercetătorul apelează la bagajul său de cunoştinţe, de pre-înţelegere a lumii, luând în calcul contextul social şi istoric în care trăiesc participanţii la studiu (Laverty, ) Spre deosebire de această paradigmă, îmbrăţişată îndeosebi de ştiinţele umaniste, paradigma pozitivistă apelează la alte reguli de apreciere a calităţii unor studii Dacă în abordarea de tip interpretativ cercetătorul introduce ca input cunoştinţele sale şi se bazează pe subiectivism pentru a desprinde semnificaţii, în paradigma pozitivistă cercetătorul încearcă să elimine orice input subiectiv din interpretarea datelor, bazându-se doar pe cel oferit din datele colectate prin apelul la o metodologie riguroasă De aceea, în analiza calităţii cercetărilor efectuate, paradigma pozitivistă ţine cont de nivelul de întemeiere a concluziilor, din perspectiva valorii lor de adevăr („cât de siguri suntem că afirmaţia respectivă este adevărată sau falsă?”), acest lucru fiind determinat în funcţie de adecvarea metodologiei utilizate la întrebarea cercetării Această distincţie esenţială pentru aprecierea calităţii unei cercetări (prin prisma „valorii ei de adevăr obiectiv”, respectiv din prisma „progresului în înţelegerea fenomenului şi a nivelului de împărtăşire a esenţialului din fenomenul trăit”) este deseori ignorată, fapt ce poate duce la confuzii importante şi rezultate distorsionate Un exemplu grăitor în acest sens este studiul tulburărilor emoţionale ale adolescenţilor rămaşi acasă şi ai căror părinţi muncesc în străinătate Apelând la o metodologie calitativă de investigare, specifică unui demers interpretativ, vom putea ajunge la o concluzie împărtăşită de participanţi, aceea a experimentării unor dificultăţi de ordin emoţional, resimţite subiectiv ca urmare a dorului de părinţi şi a insuficienţei suportului emoţional perceput Dar este această metodologie capabilă să răspundă la o întrebare a cercetării de tip cauzal (plecarea părinţilor determină probleme emoţionale la copii)? Răspunsul este unul negativ Întrebări care vizează relaţii de tip cauză-efect necesită apelul la abordări metodologice riguroase, focalizate pe controlul experimental astfel încât să permită stabilirea unei valori de adevăr (adevărat sau fals) cu privire la întrebarea din studiu (pentru mai multe detalii privind rigurozitatea controlului experimental, vezi secţiunea din capitolul următor, îndeosebi prima parte) Pentru moment ne vom rezuma doar să amintim că pot exista o serie de variabile potenţial confundate pentru apariţia unor tulburări emoţionale la adolescenţii ai căror părinţi sunt plecaţi în străinătate (Sava, ), cum ar fi: (a) stilul parental autoritar mai des întâlnit în familii cu nivel scăzut de educaţie (status întâlnit frecvent printre familiile în care părinţii sunt plecaţi la muncă în străinătate) sau (b) relaţii de cuplu conflictuale existente încă dinaintea plecării în străinătate (mai des întâlnite în cazul acestui tip de familii decât în familiile cu ambii părinţi acasă) Astfel, este posibil ca eventualele tulburări emoţionale observate la adolescenţii ai căror părinţi sunt plecaţi la muncă în străinătate să nu fie cauzate de absenţa părinţilor, ci să fie existente încă dinaintea plecării lor, determinate de o vulnerabilitate emoţională crescută, specifică unor contexte familiale în care adolescentul este martor al unor conflicte repetate între părinţi, precum şi „beneficiar” al unui stil de educaţie autoritar, bazat predominant pe măsuri de constrângere În schimb, aceeaşi metodologie calitativă ar fi adecvată pentru a răspunde la o întrebare de cercetare care ar urmări să descrie „ce cred adolescenţii despre impactul emoţional determinat de plecarea părinţilor la muncă în străinătate” În acest caz, miezul întrebării constă în decelarea semnificaţiilor şi interpretărilor pe care adolescenţii le oferă trăirilor afective experimentate în noul context familial – în absenţa părinţilor de acasă, indiferent dacă credinţele lor sunt conforme cu realitatea sau unele distorsionate Tabelul Sumar al particularităţilor cercetărilor în funcţie de paradigma filosofică utilizată Aspect evaluat Paradigma pozitivistă Paradigma constructiv-hermeneutică  Asumpţii ontologice Fenomenele psihosociale au legităţi ce pot fi descoperite, asemeni legităţilor din fizică Nu există un adevăr absolut, ci diferite realităţi subiective şi adevăruri  Asumpţii epistemologice Cunoaşterea este obiectivă şi poate fi atinsă prin metode ştiinţifice riguroase Cunoaşterea este subiectivă, dependentă cultural şi filtrată de percepţiile şi trăirile individului evaluat  Rolul cercetătorului Rămâne detaşat în abordarea problemei studiate, luând măsuri active pentru a-şi menţine obiectivitatea Se implică subiectiv în temă, uneori până la nivelul de a experimenta la rândul său trăirile asociate problemei studiate  Focusul în cercetare Focalizare pe descrierea şi explicarea comportamentului Focalizare pe înţelegerea şi interpretarea trăirilor asociate comportamentului  Metodologie utilizată Predominant cantitativă, cu sublinierea diferenţelor dintre fapte şi opinii Predominant calitativă, fără a diferenţia clar între fapte şi opinii  Evaluarea validităţii concluziilor unei cercetări Ceea ce contează este valoarea de adevăr a concluziilor obţinute Ceea ce contează este măsura în care insighturile şi interpretările noi oferite ajută la o mai bună înţelegere a fenomenului şi sunt împărtăşite de către participanţi  Contribuţia la cunoaştere Sunt apreciate îndeosebi cercetările care evidenţiază legităţi, adevăruri universale, în acest sens avantajate fiind cercetările fundamentale (de tip cauzal-explicativ) Nu se urmăreşte oferirea unui răspuns clar la întrebarea cercetării, ci se preferă ca interpretarea fenomenului să conducă la noi insighturi în legătură cu tema studiată  Ilustrări ale unor teme de studiu posibile Satisfacţia profesorilor Tulburări de erecţie Fluctuaţia de personal  Relaţia dintre creşterea numărului de elevi dintr-o clasă şi satisfacţia cadrelor didactice Un studiu metaanalitic cu privire la eficienţa psihoterapiei în tratarea disfuncţiilor erectile Afectivitatea negativă ca predictor al fluctuaţiei de personal  O investigaţie narativă a percepţiilor şi emoţiilor profesorilor ca urmare a modificării dimensiunii unei clase Ce semnifică pentru bărbaţi şedinţele de psihoterapie pentru disfuncţiile erectile? O abordare fenomenologică Investigarea secvenţelor emoţionale prin care trec angajaţii care părăsesc locul de muncă   Cercetări cantitative vs cercetări calitative Este posibil ca un număr important de cititori să rămână cu impresia că aspectele menţionate în paragrafele anterioare se potrivesc pentru a distinge şi între studiile cantitative şi cele calitative, pornind de la faptul că abordarea cantitativă este opţiunea standard pentru perspectiva pozitivistă, în timp ce metodologia calitativă este opţiunea de start în studiile bazate pe paradigma interpretativă Cu toate acestea, lucrurile nu stau întotdeauna aşa Diferenţierea dintre studii de tip cantitativ şi cele de tip calitativ are în vedere metodologia utilizată în colectarea datelor, în timp ce tipul de paradigmă abordată influenţează modul în care sunt analizate şi interpretate rezultatele Astfel, este posibil ca un studiu care aplică o metodologie de cercetare de tip calitativ (interviuri aprofundate realizate pe câţiva participanţi-cheie) să apeleze la analiza de conţinut (metodă cantitativă) şi să interpreteze exclusiv rezultatele obţinute în urma acestei analize (o manieră de lucru specifică pentru abordarea pozitivistă) Astfel, nu se poate pune un semn de egalitate între cercetarea calitativă şi abordările de tip interpretativ, pentru că datele calitative colectate pot fi integrate într-o manieră pozitivistă Reversul este de asemenea teoretic posibil, deşi este mai puţin întâlnit în practică De exemplu, într-o cercetare cu un obiectiv explorator poate fi aplicată o metodologie de tip cantitativ (aplicare de chestionare în cadrul unui sondaj efectuat pe un eşantion reprezentativ), însă interpretarea să fie una de tip hermeneutic Se poate ajunge aici dacă: (a) accentul în studiu este pus mai degrabă pe interpretarea şi înţelegerea fenomenului studiat decât pe descrierea lui; (b) cercetătorul abordează într-o manieră subiectivă tema, interpretând rezultatele prin prisma opiniilor şi cunoştinţele sale anterioare despre subiect (mergând dincolo de ceea ce îi permit datele colectate); (c) îşi construieşte discursul (concluziile) într-o manieră mai degrabă hermeneutică, context în care se foloseşte de datele cantitative colectate ca temeiuri pentru comentariile sale de ordin calitativ Apoi, alegerea unei metodologii de lucru de tip cantitativ sau calitativ este dependentă şi de gradul de cunoaştere al subiectului abordat Dacă tema investigată se referă la un subiect despre care se cunosc puţine lucruri, este preferabil un demers de tip explorator, situaţie în care metodologia de tip calitativ are un avantaj prin flexibilitatea ridicată cu privire la tipul de date colectate În schimb, dacă subiectul abordat este unul cunoscut, demersul de cercetare depăşeşte stadiul unui studiu explorator, caz în care preferabilă este metodologia de tip cantitativ Prin urmare, în decizia de alegere a unei metodologii cantitative sau calitative intră doi factori importanţi: (a) gradul de cunoaştere a temei cercetate, decurgând din aceasta obiectivul de cercetat; (b) asumpţiile filosofice ale cercetătorului (aplecare spre a descrie şi explica realitatea observabilă sau spre a interpreta şi acorda semnificaţii aspectelor [realităţii] construite) O serie de cercetători precum Kazdin ( ), Elliot şi Timulak ( ) sau Bedos, Pluye, Loignon şi Levine ( ) au subliniat principalele diferenţe dintre metodologia cantitativă şi cea calitativă, cele mai importante fiind reflectate în tabelul Aceste informaţii sunt utile pentru a oferi celor interesaţi o privire de ansamblu pentru a aprecia care metodologie ar trebui utilizată în funcţie de problema investigată (obiectivul studiului) Tabelul Sumar al particularităţilor metodologiei cantitative vs calitative Aspect evaluat Metodologia cantitativă Metodologia calitativă  Obiectivul studiului De obicei este unul inferenţial, bazat pe formularea şi testarea unor ipoteze de cercetare menite să identifice asocieri între variabile sau diferenţe între grupuri Este unul explorator, cu rolul de a descrie şi interpreta (sau oferi insighturi pentru) problema studiată, fără a testa ipoteze de cercetare  Stadiul cunoaşterii problemei studiate Aplicabilă îndeosebi asupra unor probleme cercetare anterior, despre care există deja o serie de cunoştinţe Tema investigată este formulată adesea într-o manieră închisă, exactă (vezi modelul PICO amintit în primele două capitole) Aplicabilă îndeosebi în studiul unor probleme noi, despre care nu se cunoaşte nimic sau se cunosc informaţii insuficiente Tema investigată este formulată vag, adesea sub forma unei întrebări cu răspuns deschis (de exemplu, „În ce mod resimt adolescenţii plecarea părinţilor la muncă în străinătate?”)  Stilul de lucru în cercetare Importanţă acordată controlului variabilelor cu potenţial confundat şi riscurilor rezultate din tipul de design utilizat, pentru a reduce numărul de explicaţii posibile (explicaţii alternative pentru rezultatul obţinut) Variabilele relevante sunt studiate în contextul lor natural, fără a încerca să izoleze influenţa acestora de alţi factori cu potenţial de variabile confundate Accentul se pune pe întreg, pe complexitatea descrierilor şi interpretărilor, pe sensuri multiple care pot rezulta din datele colectate  Numărul de participanţi Număr mare pentru a asigura o putere statistică adecvată în procesul de testare a ipotezelor Număr mic de participanţi, compensat prin studierea lor în manieră intensivă (vezi tipul de date colectate)  Tipul datelor colectate Date numerice, preferabil prin intermediul unor instrumente standardizate Descrieri narative, istorisiri, care nu sunt ulterior prelucrate în termeni cantitativi (analiza de conţinut fiind o metodă cantitativă)  Flexibilitate metodologică Scăzută De obicei întreaga procedură este una standardizată, algoritmică, mergând în cazul experimentelor până la măsuri cum ar fi contrabalansarea, pentru a contracara distorsionări potenţiale în rezultate Medie Există o planificare iniţială, care poate fi ajustată pe parcursul colectării datelor, în funcţie de nevoi (de exemplu, în cazul utilizării interviurilor sunt preferate cele nestructurate sau semistructurate)  Analiza datelor colectate Prin intermediul tehnicilor statistice, ţinând seama în interpretare de limitările impuse de designul de cercetare utilizat Analiză de text cu scopul: (a) de a descrie (de exemplu, a stabili teme centrale asociate problemei studiate din perspectiva trăirilor participanţilor); (b) de a interpreta/oferi sensuri şi semnificaţii acestor trăiri, prin apelul la filtrul subiectiv sau amprenta cercetătorului şi la teoriile naive ale participanţilor chestionaţi  Aprecierea calităţii demersului de cercetare Sunt preferabile studiile ale căror rezultate sunt replicate şi care conduc la teorii care să ne ajute să descriem şi explicăm mai bine aspectele psihologice investigate Sunt preferate studiile ce conţin descrieri care captează esenţa fenomenului studiat Rezultatul este împărtăşit de ceilalţi şi poate fi replicat şi/sau obţinut din surse multiple (triangulare), accentul fiind pus pe înţelegerea aprofundată a fenomenului  Desigur, aşa cum în cazul metodologiei cantitative există diferenţe mari de la un anumit tip de studiu la altul (de exemplu, între un sondaj de opinie şi un studiu experimental), în mod similar, sub umbrela metodologiei calitative se regăsesc o multitudine de abordări posibile Creswell ( ) aprofundează cinci asemenea direcţii: (a) studiile narative (accentul cade pe intervievarea subiecţilor pentru a relata istorioare din viaţa lor [istorii orale], urmate de realizarea unei sinteze literare în care să fie relatată viaţa indivizilor); (b) studiile fenomenologice (accentul este pus pe surprinderea esenţei experienţei studiate); (c) studiile etnografice (accentul se face pe interpretarea experienţelor respective prin prisma culturii împărtăşite de grupul din care indivizii fac parte); (d) studiile fundamentate (grounded theory) (în care se accentuează ideea generării unei teorii/perspective despre experienţa analizată pe baza opiniilor colectate de la participanţii la studiu) şi (e) studiile de caz de tip calitativ (în care predomină interesul de a obţine o analiză profundă a experienţei/individului, preferabil prin prisma unei teorii, făcând apel la surse multiple de documentare) În sfârşit, merită subliniată expansiunea unei abordări ştiinţifice noi, cunoscută sub denumirea de metodologie mixtă (Tashakkori şi Teddlie, ), designul metodelor de cercetare mixte (Creswell, ) sau, mai frecvent, metode de cercetare mixte (mixed method research) (Creswell, ) Aceasta încearcă să combine demersul cantitativ, cu cel calitativ, pentru a beneficia de avantajele strategice ale ambelor metodologii (o înţelegere aprofundată a constructului studiat – abordarea calitativă; controlul variabilelor străine şi o creştere a nivelului de generalizare a rezultatelor – abordarea cantitativă) (Creswell, ; Steckler et al , ) Figura prezintă patru situaţii în care este recomandabilă utilizarea unui design mixt, primele două în care metodologia calitativă este utilizată ca un adjuvant la cea cantitativă, cea de-a treia referindu-se la reversul situaţiei, iar ultima, ca un posibil exemplu de triangulare, astfel încât rezultatul obţinut să fie sprijinit prin utilizarea ambelor tipuri de metodologie  Figura Ilustrarea celor mai întâlnite tipuri de design mixt Adaptare după Steckler et al ( ) Cercetări experimentale vs cercetări cvasiexperimentale vs cercetări non-experimentale Ultimele două clasificări ale tipurilor de cercetări menţionate la şi au drept caracteristică comună faptul că se bazează pe diferenţele existente la cel mai general nivel, cel al metodologiei cercetării În practică se întâmplă rar să se ia decizii la acest nivel de generalitate, de aceea probabil că % dintre cercetările psihologice existente îmbrăţişează paradigma dominantă, aceea a unui metodologii pozitiviste de tip cantitativ În acord cu această stare de fapt a fost proiectată structura acestei cărţi, accentul fiind pus pe metodologia cantitativă de orientare pozitivistă, pentru a putea răspunde fluxului principal de preocupări din domeniul cercetării psihologice În schimb, clasificarea tipurilor de studii în cercetări experimentale vs cvasiexperimentale vs non-experimentale, vizează cel de-al doilea nivel de generalitate, cel al tipului de design al cercetării Astfel că în acest caz, spre deosebire de cazul celorlalte clasificări menţionate, cercetătorul joacă un rol activ în determinarea tipului de cercetare efectuată Acest lucru se întâmplă pentru că la baza clasificării studiilor în cele trei categorii se are în vedere nivelul de control exercitat de către cercetător asupra variabilelor străine Cu cât se exercită un control mai drastic într-un studiu asupra acestor variabile potenţial confundate, cu atât creşte încrederea în concluziile cercetării respective În termeni tehnici există două măsuri cu rol de control, cu caracter obligatoriu, care trebuie luate din perspectiva designului unei cercetări pentru a creşte încrederea în validitatea rezultatelor studiului Acestea privesc exercitarea unui control riguros asupra variabilelor potenţial confundate prin: (a) manipularea variabilei independente cu scopul de a varia efectul acesteia asupra variabilei dependente (de exemplu, se evaluează două forme diferite de intervenţie şcolară menite să diminueze abandonul şcolar); (b) distribuirea aleatorie a participanţilor la studiu în cele două tipuri de intervenţie, cu scopul de a egaliza (controla) efectul pe care alte variabile potenţial confundate îl poate avea asupra variabilei dependente Dacă sunt îndeplinite amândouă cerinţele, vorbim despre studii experimentale Dacă niciuna dintre condiţii nu este îndeplinită vorbim despre studii non-experimentale În sfârşit, dacă doar condiţia (a) este îndeplinită vorbim despre studii cvasiexperimentale Acestea mai sunt cunoscute şi sub denumirea de studii experimentale „slabe”, fiind încadrate de anumiţi autori în categoria generală a experimentelor, ca urmare a rolului activ pe care îl joacă cercetătorul prin manipularea variabilei independente (Shadish et al , ) Detalii suplimentare despre studiile experimentale (inclusiv cele cvasiexperimentale), respectiv despre studiile non-experimentale sunt oferite pe larg în capitole distincte ale acestei cărţi (capitolele şi ) Am rezervat acest spaţiu larg de prezentare a caracteristicilor acestor tipuri de studii datorită impactului ridicat pe care îl au asemenea informaţii în dezvoltarea gândirii critice cu referire la calitatea unei cercetări şi în planificarea studiilor empirice din psihologie Aceste competenţe tehnice sunt esenţiale în realizarea de cercetări, fiind fundamentale pentru planificarea şi derularea în bune condiţii a unui studiu Cercetări exploratorii vs cercetări descriptive vs cercetări cauzale Distincţia dintre studii experimentale şi cele non-experimentale este prezentă în orice manual introductiv de psihologie experimentală/metodologia cercetării În schimb, mai puţin cunoscută este o altă taxonomie importantă pentru dezvoltarea gândirii critice legate de cercetări, ce are în vedere clasificarea lor în funcţie de tipul de obiectiv vizat de studiu (scopul studiului) Clasificarea cercetărilor în funcţie de tipul de obiectiv vizat de studiu este esenţială, deoarece, aşa cum remarca Brewer ( ), evaluarea validităţii unui studiu, adică a nivelului de adevăr al afirmaţiilor rezultate în baza studiului, nu se face per se, ci în funcţie de tipul de obiectiv urmărit De aceea, cu cât obiectivul este unul mai ambiţios (de exemplu, să explice de ce apare un fenomen, nu doar să-l descrie), cu atât sunt necesare mai multe măsuri de control la nivelul designului studiului Prin urmare, tipul de obiectiv studiat are impact direct asupra designului ales (de exemplu, studiul non-experimental de tip corelaţional etc ) Tabelul oferă o descriere succintă a tipurilor de cercetări în funcţie de obiectivul studiului, iar figura oferă o privire de ansamblu asupra legăturii dintre cele două clasificări avute în vedere ( şi ), luând în considerare alte consecinţe majore implicate la nivel de design (evaluate la un nivel inferior [mai concret] de analiză decât cel menţionat în secţiunea ) Tabelul Tipuri de studii din perspectiva obiectivului cercetării O privire sintetică Clasificare după obiectivul vizat Descriere succintă (tipuri de întrebări ale cercetării vizate)   Exploratoriu Se referă la studii bazate pe metodologii calitative (mai frecvent) sau pe metodologii cantitative asupra unei teme despre care nu se cunoaşte nimic sau se cunosc foarte puţine lucruri Două atribute specifice ale acestor studii sunt: (a) studiul nu are prestabilite ipoteze care să fie testate (de aici caracterul explorator); (b) deşi are libertatea de a-şi propune, fie să descrie, fie să prezică, fie chiar să ofere explicaţii pentru fenomenele studiate, concluziile din aceste studii sunt provizorii (nu permit stabilirea cu claritate a valorii de adevăr a concluziilor studiului) Aceste concluzii provizorii pot deveni ipoteze de cercetare ce urmează a fi testate în studii ulterioare   Descriptiv A Descriptiv propriu-zis B Analitic Se referă la studii bazate preponderent pe metodologii de tip cantitativ, non-experimentale (observaţionale), realizate cu scopul de a descrie cât mai acurat fenomenul studiat prin cercetări de teren („care este prevalenţa cazurilor de ADHD printre adolescenţii cu părinţi plecaţi la muncă în străinătate?” ( A), „câte subtipuri de ADHD există?” ( A), „care sunt modalităţile adaptive, respectiv dezadaptive de răspuns (coping) în situaţiile de epuizare emoţională?” ( A), „există o legătură între nivelul de agresivitate şi cogniţiile iraţionale autodepreciative?” ( B), „nivelul stimei de sine al persoanelor care au suferit un eşec şcolar este mai redus decât cel din lotul celor fără eşec şcolar etc ” ( B) În cazul subtipului „studii descriptive propriu-zise” ( A), analizele statistice efectuate se rezumă la indicatori descriptivi, nefiind formulate ipoteze de cercetare Printre cele mai întâlnite studii de acest gen sunt studiile de caz , sondajele de opinie şi studiile bazate pe metoda observaţiei În cazul subtipului de obiective descriptive analitice ( B), studiile efectuate conţin ipoteze de cercetare verificate prin intermediul tehnicilor statistice inferenţiale Cel mai frecvent, pentru a răspunde la aceste obiective se apelează la studiile non-experimentale de tip corelaţional sau la cele de tip comparativ, non-experimental (case control studies) Pornind de la descrierea asocierilor observate, studiile descriptiv-analitice permit formularea de predicţii, de exemplu, cu privire la relaţia dintre variabila studiată şi alte variabile de interes (de exemplu, identificarea factorilor de risc care contribuie la apariţia anxietăţii sociale) Identificarea predictorilor nu este însă echivalentă cu identificarea cauzei pentru apariţia fenomenului avut sub observaţie, deoarece predictorul poate juca orice rol în asocierea cu criteriul de interes, inclusiv cel de variabilă confundată De exemplu, dacă nivelul de studii (numărul de ani de şcoală) prezice preferinţa pentru un anumit post muzical de radio, ca urmare a asocierii dintre cele două variabile, nu înseamnă însă că educaţia reprezintă şi sursa (cauza) acestei preferinţe   Cauzal A Cauzal-descriptiv B Cauzal-explicativ Se referă, în exclusivitate, la studii bazate pe o metodologie cantitativă riguroasă, (experimente şi, eventual, cvasiexperimente) interesate de identificarea unor relaţii cauzale şi a unor explicaţii (mecanisme cauzale) responsabile pentru apariţia efectului urmărit Prin acest tip de obiective se trece dincolo de simpla descriere a unui comportament (fenomen), accentul fiind pus pe oferirea de explicaţii pentru dinamica comportamentului studiat În cercetarea aplicată, axată pe aspecte de utilitate, un scop de tip cauzal-descriptiv este suficient Cu ajutorul experimentelor se vizează doar demonstrarea unei relaţii de tip cauză-efect („coaching-ul cognitiv-comportamental este eficient în reducerea stresului ocupaţional”), fără a valida ştiinţific explicaţia pentru care acest lucru se întâmplă În cercetarea fundamentală, axată pe a găsi explicaţii (de ce este coaching-ul cognitiv-comportamental eficient în diminuarea stresului ocupaţional?), se apelează la scopuri cauzal-explicative, care urmăresc să expliciteze mecanismul cauzal În acest caz, accentul este pus pe demonstrarea relaţiei cauzale, dar mai ales pe explicarea (identificarea) ingredientului activ („de ce şi în ce context funcţionează relaţia cauzală?”)   Figura Implicaţii în alegerea tipului de studiu în funcţie de designul cercetării şi de scopul urmărit Se observă, ca aspect de principiu, că obiectivul (scopul) unui studiu poate fi atins numai prin anumite tipuri de studii, în funcţie de particularităţile designului pe care îl implică acesta Bunăoară, în cazul studiilor cu obiective de tip descriptiv sunt disponibile mai multe alternative de studiu, din categoria celor care prezintă un design non-experimental De exemplu, pentru a descrie relaţia dintre două variabile, cum ar fi dacă există o asociere între satisfacţia în relaţia de cuplu şi nivelul de romantism, este suficient să apelăm la un studiu corelaţional, ca model potrivit pentru scopuri de tip descriptiv-analitic Nu este nevoie să apelăm la designuri mai complicate şi mai costisitoare, de tipul studiilor cu design experimental, pentru că se poate răspunde la întrebare şi prin studii mai uşor de implementat, cum sunt cele cu un design non-experimental De asemenea, este mai puţin util să se apeleze la studii care urmăresc obiective exploratorii, deoarece concluziile obţinute prin aceste studii au un caracter provizoriu, generând ipoteze care ar trebui validate ulterior prin alte studii cu scop descriptiv În schimb, dacă ceea ce se urmăreşte prin studiu este de a identifica o posibilă relaţie cauzală, studiul corelaţional se dovedeşte a fi insuficient pentru că nu poate tranşa clar sursa corelaţiei observate (care dintre următoarele variante este mai apropiată de adevăr): (a) în relaţiile de cuplu cu un nivel ridicat de satisfacţie apar mai frecvent dovezi de romantism (satisfacţia maritală cauzează intensificarea romantismului); (b) prin creşterea frecvenţei actelor romantice sporeşte satisfacţia maritală (romantismul conduce la o satisfacţie maritală mai mare); (c) între cele două variabile există o intercondiţionare reciprocă, asemenea unui cerc „virtuos” (pe măsură ce sporesc comportamentele romantice creşte satisfacţia maritală, iar aceasta induce, la rândul ei, o predispoziţie spre şi mai multe comportamente romantice etc ); (d) ambele variabile studiate sunt efecte ale duratei relaţiei de cuplu (cuplurile formate mai recent percep un nivel mai ridicat de romantism şi un nivel mai ridicat al satisfacţiei în relaţia de cuplu) Pentru a elimina dintre variantele menţionate pe acelea care nu sunt sprijinite de date, va trebui să adoptăm un alt tip de studiu decât cel corelaţional transversal De pildă, pentru a observa gradul de sprijin existent pentru cele menţionate la punctul (d), ar fi util un studiu longitudinal care ar presupune urmărirea pe o anumită perioadă de timp a modului în care variază cele două variabile, pe măsură ce durata relaţiei de cuplu creşte Însă cea mai bună variantă de a verifica dacă există o relaţie de tip cauzal este apelul la studii experimentale, dacă acestea sunt permise din punct de vedere etic În exemplul oferit ar putea fi verificată astfel doar varianta (b), deoarece nivelul comportamentului romantic poate fi manipulat experimental, în schimb ar fi inadecvat din punct de vedere etic să manipulăm nivelul satisfacţiei în relaţia de cuplu Spre exemplu, participanţii la un asemenea studiu ar putea fi distribuiţi randomizat în două grupe experimentale: una care să cuprindă persoane care sunt instruite de către un consilier de cuplu cum anume să-şi surprindă partenerul prin acte romantice, ceilalţi incluşi într-un grup de tip placebo (discuţii purtate cu consilierii de cuplu despre problemele lor maritale, cu scopul de a facilita catarsisul; consilierii rezumându-se la un rol suportiv, asemenea unui prieten) Dacă la finalul intervenţiei primul grup (cel care a deprins şi exersat abilitatea de a se comporta în mod romantic faţă de partener) va avea un nivel mai ridicat de satisfacţie în relaţia de cuplu decât cel de-al doilea grup, există dovezi empirice cu privire la rolul cauzal pe care îl joacă comportamentul romantic în creşterea satisfacţiei faţă de relaţia de cuplu Atunci când apelul la studii experimentale nu este posibil (din motive etice sau logistice), se pot apela la variante de suplinire cum sunt studiile cvasiexperimentale sau studiile longitudinale (vezi liniile întrerupte din figura ) Acestea pot oferi indicii în sprijinul sau împotriva unei relaţii de tip cauzal, însă nu sunt la fel de sigure precum studiile experimentale în identificarea unei relaţii cauzale În cazul în care o asemenea relaţie cauzală este sprijinită empiric, cercetările ulterioare îşi pot propune obiective de tip explicativ pentru a identifica mecanismele cauzale responsabile pentru efectul observat În exemplul nostru ipotetic, dacă se demonstrează experimental că comportamentul romantic determină o creştere a satisfacţiei maritale, se pot concepe studii de tip experimental care să ofere explicaţii valide pentru această relaţie cauzală Orice alt tip de studiu, în afara celui experimental, nu beneficiază de suficientă rigurozitate metodologică pentru a elimina probleme specifice variabilelor cu potenţial confundat Spre exemplu, printre explicaţiile posibile pentru relaţia cauzală constatată putem identifica: (a) comportamentele romantice conduc la intensificarea percepţiei că partenerul ne iubeşte sincer, iar acest lucru conduce la o creştere a satisfacţiei maritale (afectivitatea recepţionată ca factor explicativ pentru creşterea satisfacţiei maritale în urma comportamentelor romantice); (b) relaţia cauzală este determinată de activarea normei de reciprocitate în cazul partenerului (comportamentul nostru romantic conducând la reacţii pozitive din partea partenerului, care la rândul lui răspunde prin gesturi pozitive, fapt care conduce la o intensificare a satisfacţiei cu privire la relaţia de cuplu – norma de reciprocitate ca factor explicativ pentru creşterea satisfacţiei maritale în urma adoptării unui comportament romantic) Seria de posibile explicaţii alternative pentru relaţia cauzală identificată ar putea continua Ceea ce ne interesează aici este sublinierea faptului că singura modalitate de a trece de la nivelul speculativ de enumerare a unor posibile explicaţii pentru relaţia cauzală identificată la stadiul de a valida ştiinţific (de a stabili valoarea de adevăr a acestor explicaţii) este apelul la studii experimentale, în care să fie manipulate, pe rând, explicaţiile propuse Ideal, ar putea fi propuse studii în care să fie testate (comparate direct) două sau mai multe asemenea explicaţii posibile, însă dacă acest lucru nu este posibil, explicaţiile respective pot fi evaluate succesiv, printr-o serie de studii experimentale Nu vom insista aici asupra dezvoltării exemplului menţionat în cazul unor studii cu obiective explicative, deoarece cititorii interesaţi pot găsi o asemenea ilustrare în caseta (din capitolul ) În schimb, vom preciza două caracteristici ale demersurilor de tip cauzal-explicativ, menţionate de Shadish et al ( ): tendinţa spre abordare moleculară în locul uneia molare, respectiv tendinţa spre abordarea multinivelară Prima se referă la tendinţa întâlnită de a descompune factorul-cauză în subcomponente pentru a diferenţia care anume dintre ingredientele respective reprezintă factorul activ Dacă în cercetarea cu scop cauzal-descriptiv abordarea molară este suficientă (de exemplu, de a arăta că terapia raţional emotivă este eficientă în combaterea depresiei), în cercetarea în scop cauzal-explicativ se caută a se evidenţia ce anume din ceea ce se realizează în cadrul terapiei raţional-emotive reprezintă mecanismul schimbării, fiind responsabil pentru ameliorarea simptomatologiei depresive („este vorba doar de un factor comun, cum ar fi încrederea în psihoterapeut?” sau „sunt anumite elemente specifice cum ar fi modificarea cogniţiilor iraţionale autodepreciative?” etc ) Identificarea elementului activ sau a setului de elemente active este un aspect esenţial, nu numai pentru procesul cunoaşterii în sine (facilitează dezvoltarea de noi teorii cu privire la modul de funcţionare psihică), ci şi pentru a putea proiecta intervenţii optimizate (care să valorifice mai bine ingredientele active responsabile pentru efectul dorit, cum ar fi o variantă de psihoterapie raţional-emotivă care să accentueze exerciţiile de disputare şi modificare a cogniţiilor iraţionale autodepreciative în unele raţionale, dacă se dovedeşte că aceste cogniţii stau la baza concluziilor din studiile experimentale focalizate spre a arăta de ce psihoterapia raţional-emotivă este eficientă în combaterea depresiei Cea de-a doua caracteristică specifică abordării cauzal-explicative vizează abordarea multinivelară Astfel, mecanismele cauzale analizate pot viza niveluri diferite de generalitate, respectiv de focalizare pe aspecte implementaţionale (biologice) În exemplul amintit pot fi căutate explicaţii de sorginte neuropsihologică (modificări la nivelul unor neurotransmiţători chimici), de natură psihologică abstractă (nivelul general de iraţionalitate cognitivă) sau de natură psihologică concretă (cogniţiile iraţionale de tip autodepreciative) De asemenea, explicaţiile pot viza diferite cadre conceptuale (raportarea la diferite teorii), în funcţie de teoria psihologică îmbrăţişată de cercetător, putând fi oferite explicaţii de sorginte psihodinamică, a terapiei familial-sistemice etc Acestea pot fi considerate valide, atâta timp cât sunt sprijinite empiric de studii care utilizează un design adecvat (în speţa de faţă, unul experimental) pentru a răspunde obiectivului studiului, acela de a oferi explicaţii valide ştiinţific pentru relaţia cauzală observată Un alt aspect care ar trebui subliniat cu privire la figura vizează pleiada de studii care fac apel la un design non-experimental Numărul de studii care apelează la un design non-experimental este mai mare decât cel prezentat în figura respectivă (de exemplu, lipsesc studiile care apelează la o metodologie calitativă) Capitolul este destinat descrierii acestei categorii de studii denumite generic studii non-experimentale Ceea ce ar trebui subliniat aici este faptul că studiile bazate pe un design non-experimental pot fi utilizate interschimbabil, în genere, atât pentru obiective de tip descriptiv, cât şi pentru cele de tip explorativ De exemplu, studiul de caz, aşa cum remarca şi Kazdin ( ), se poate dovedi util atât în scopuri exploratorii (ca sursă de idei şi ipoteze pentru studii viitoare), cât şi în scopuri descriptive propriu-zis (pentru a ilustra, în scop educaţional sau de advocacy, cazuri particulare în sprijinul unei teorii sau unei intervenţii psihologice; pentru a descrie aspecte psihologice rar întâlnite) De asemenea, un tip aparte de studii non-experimentale (studiile longitudinale dintre care cel mai întâlnit tip sunt studiile pe cohorte) poate fi utilizat pentru a infera afirmaţii de tip cauzal, atunci când datele experimentale lipsesc sau nu pot fi colectate din motive etice sau logistice Acest lucru este posibil pentru că una dintre premisele unei relaţii de tip cauză-efect este aceea de a observa că modificările la nivelul variabilei-cauză precedă temporal modificările la nivelul variabilei-efect, iar observarea acestui lucru este posibilă doar într-un design longitudinal, ce presupune observarea evoluţiei participanţilor la studiu de-a lungul timpului La finalul acestei secţiuni merită să subliniem caracterul cumulativ al cunoaşterii, cu implicaţii asupra tipului de studii care ar trebui utilizate în funcţie de stadiul cunoaşterii în cazul temei studiate Astfel, studiile care urmăresc un obiectiv cauzal-explicativ nu îşi au sensul până când nu există dovezi ale existenţei unei relaţii cauzale, abordabilă prin obiective de tip cauzal-descriptiv De asemenea, nu are rost să căutăm a identifica relaţii de tip cauză-efect ca atare (obiectiv descriptiv) în absenţa unor dovezi cu privire la existenţa unei relaţii În sfârşit, în multe cazuri, înainte de a avea studii descriptive cu un demers coerent (în care să ştim ce să căutăm) ar fi util să apelăm la studii exploratorii pentru a ne face o impresie despre ce anume să studiem ulterior într-o manieră sistematică Cu alte cuvinte, deşi experimentele sunt cele mai riguroase din punct de vedere metodologic, ele sunt cele mai dificil de implementat şi nu îşi au sensul în absenţa unor dovezi empirice deja existente cu privire la descrierea fenomenului studiat În consecinţă, studiile experimentale în psihologie sunt mai potrivite pentru a adresa întrebări de cercetare mature, în timp ce studiile de tip non-experimental sunt utile pentru a strânge, mai degrabă într-o manieră nesistematică, acea cantitate de informaţii necesară pentru a permite saltul în cunoaşterea domeniului atât prin evaluări sistematice sau narative ale literaturii de specialitate din domeniu, cât şi prin trecerea la nivelul următor de interes al oricărui demers ştiinţific, cum ar fi trecerea de la descriere către predicţie şi către oferirea de explicaţii pentru problema studiată Aprecierea validităţii afirmaţiilor din studiile efectuate În esenţă apelăm la ştiinţă ca sursă a cunoaşterii în defavoarea oricărei alte surse de cunoaştere (apelul la autoritatea academică, la convingeri personale etc ) pentru că ne aşteptăm ca prin apelul la demersul ştiinţific să ajungem să cunoaştem realitatea (răspunsul corect la întrebarea de cercetare adresată) şi să formulăm concluzii solide, fundamentate despre problematica studiată Validitatea unei cercetări se poate referi, în cazuri rare, la studiul în ansamblul său (dacă designul utilizat este total inadecvat pentru a răspunde la întrebarea adresată prin cercetare), însă cel mai frecvent are în vedere orice afirmaţie extrasă în baza cercetării realizate, apreciind măsura în care studiul respectiv, prin caracteristicile sale metodologice, poate acoperi valoarea de adevăr a afirmaţiei în cauză (se poate stabili fără doar şi poate că afirmaţia respectivă este una adevărată, validă) De aceea, aşa cum afirma Brewer ( ), discuţia despre validitate nu se referă la cercetarea în sine, ci priveşte mai degrabă validitatea studiului în raport cu obiectivul urmărit prin studiu (vezi caseta ) Caseta Ilustrări ale impactului pe care obiectivul urmărit (şi implicit tipul de studiu) îl are asupra validităţii afirmaţiilor rezultate din studiu Exemplul Identificarea măsurii în care există o legătură între nivelul de violenţă din desenele animate urmărite şi nivelul de agresivitate al copiilor (context: studiu non-experimental transversal de tip corelaţional implementat corect, cu rezultate ce indică o asociere semnificativă statistic) Obiectiv vizat: descriptiv-analitic Rezultat: nivelul de agresivitate al copiilor corelează pozitiv cu gradul de violenţă din conţinutul desenelor urmărite Concluzie (afirmaţie) validă în baza observaţiei: fiind un studiu corelaţional, nu se poate stabili clar sursa acestei asocieri Astfel este posibil fie ca desenele cu un conţinut violent să inducă o creştere a nivelului de agresivitate în rândul copiilor, fie să asistăm la un efect al autoselecţiei, prin care copiii cu un nivel mai ridicat de agresivitate să prefere să urmărească mai frecvent desene cu conţinut violent, deoarece acestea le răspund mai bine nevoilor Concluzie (afirmaţie) nevalidată în baza observaţiei (studiul efectuat nu poate stabili dacă este corectă sau nu afirmaţia respectivă): acest rezultat sprijină poziţia grupurilor de advocacy de a condamna conţinutul violent din desene animate, observându-se că nivelul violenţei creşte pe măsură ce sunt vizionate mai multe desene cu conţinut violent Explicaţia pentru această stare de fapt este aceea că copiii învaţă că actele violente pot constitui un mod uzual de comportament soldat cu succes (agresivitatea ca mijloc instrumental în atingerea scopului dorit) Exemplul Demonstrarea unei relaţii cauzale, conform căreia desenele animate cu un conţinut violent determină creşterea nivelului de agresivitate la copii (context: studiu experimental implementat corect, cu rezultate ce indică diferenţe semnificative între cele două grupe, în direcţia aşteptată) Obiectiv vizat: cauzal-descriptiv Rezultat: un nivel mai ridicat al agresivităţii măsurate posttest în grupul experimental (cei care au vizionat desene cu conţinut violent) decât în grupul de control (cei care au vizionat desene fără conţinut violent) Concluzie (afirmaţie) validată*/**: datele obţinute sprijină ideea că desenele cu un conţinut violent induc agresivitate în rândul copiilor Acest rezultat sprijină poziţia grupurilor de advocacy de a condamna conţinutul violent din desene animate Concluzie (afirmaţie) nevalidată: explicaţia pentru această stare de fapt este aceea că copiii învaţă că actele violente pot constitui un mod uzual de comportament soldat cu succes (agresivitatea ca mijloc instrumental în atingerea scopului dorit) * Am semnalat prin asterisc cazul respectiv pentru că doar apelul la un design potrivit (de exemplu, un studiu experimental) nu este suficient pentru a valida afirmaţii cauzale Este la fel de important ca implementarea să fie una corectă De pildă, dacă studiul este efectuat pe băieţi, iar grupul experimental urmăreşte desene din seria Ben , în timp ce copiii din grupul de control vizionează Bambi, diferenţele constate pot fi determinate de alte variabile confundate (cum ar fi nivelul de atractivitate, respectiv de familiaritate diferit pentru cele două desene, mai ridicat pentru Ben în cazul băieţilor) sau de gradul diferit de similaritate dintre jucăriile avute la dispoziţie şi personajele din desene (variabila dependentă fiind măsurată prin observarea comportamentului copilului prin joc, ulterior vizionării desenului) Astfel, dacă în grădiniţă sunt mai degrabă jucării din seria Ben sau alte personaje extraterestre similare, dar nu există căprioare sau alte personaje incluse în Bambi, există riscul ca efectul observat să fie ca urmare a facilitării ridicate a transferului unor scenarii din desene în jocul de rol al copiilor în favoarea celor pentru care există recuzita necesară Cu alte cuvinte, este important ca manipularea experimentală să fie una adecvată pentru a surprinde factorul cauzal anticipat şi pentru a controla alte variabile potenţial confundate (de exemplu, ar fi potrivit a se apela la două episoade din acelaşi serial de desene [aceleaşi personaje de bază], unul cu conţinut violent, altul fără violenţă) ** Cu toate măsurile de control ce pot fi luate pentru a elimina o serie de riscuri la adresa validităţii unui studiu, este imposibil să fie acoperite toate situaţiile posibile, motiv pentru care: (a) niciun studiu nu poate atinge perfecţiunea (lipsa totală a oricărui risc privitor la validitatea concluziilor sale); de exemplu, apelul la studii randomizate controlate, deşi necesar pentru a urmări un obiectiv de tip cauzal-descriptiv sau cauzal-explicativ, nu constituie o garanţie pentru validitatea afirmaţiilor ce fac referiri la aspecte cauzal-descriptive sau cauzal-explicative; (b) ideea de valoare de adevăr (rezultat valid) trebuie privită în termeni probabilistici (este foarte probabil ca afirmaţia să fie una validă, adevărată), nu în termeni absoluţi De aceea, în redactarea acestei secţiuni, pe care o consider fundamentală pentru a înţelege esenţa demersului de cercetare şi a permite evaluarea contribuţiei aduse de diferite studii, am apelat atât la surse clasice, cât şi la surse complementare Dintre sursele clasice care tratează problematica validităţii se disting contribuţiile lui Shadish et al ( ) sau Cook şi Campbell ( ), în special în descrierea principalelor riscuri privitoare la validitatea concluziilor unui studiu experimental sau cvasiexperimental Însă, dincolo de această discuţie generală despre validitatea unei cercetări, vom introduce în discuţie surse complementare precum Kazdin ( ), al cărui principal merit este de a prezenta riscuri mai puţin cunoscute privitoare la validitatea concluziilor unui studiu, dar importante din perspectiva psihologiei validate ştiinţific (fundamentate empiric), cum sunt efectul de noutate sau planificarea asincronă a evaluărilor, atunci când se apreciază validitatea eficienţei unei intervenţii Mai mult, pornind de la afirmaţia repetată cu mai multe ocazii pe parcursul acestei cărţi, aceea că nu este posibil să fie realizată o cercetare „perfectă”, lipsită de riscuri privitoare la validitatea concluziilor sale, voi aprofunda discuţia despre validitatea unui cercetări în funcţie de obiectivul studiului respectiv Tipurile de validitate discutate au importanţă diferită în funcţie de scopul studiului De exemplu, pentru un studiu experimental ce îşi propune un obiectiv cauzal-descriptiv, esenţial este ca acesta să răspundă îndeosebi aspectelor de validitate internă (demonstrarea relaţiei cauză-efect) şi secundar aspectelor care ţin de validitatea externă (nivelul de generalizare a relaţiei cauzale observate în alte contexte) În schimb, într-un studiu non-experimental ce îşi propune un obiectiv descriptiv, de tipul sondajului de opinie, se acordă o importanţă mai mare aspectelor ce ţin de validitatea de construct, respectiv cea externă, preocuparea fiind foarte redusă pentru problematica validităţii interne, pentru că prin definiţie aceasta ar urmări nivelul de adevăr al inferenţelor cu referire la relaţii de tip cauzal, aspect care nu poate fi surprins adecvat prin intermediul unui sondaj de opinie În consecinţă, dincolo de prezentarea principalelor tipuri de validitate, ne propunem în secţiunea de faţă să extindem viziunea prezentată de Brewer ( ), cu privire la impactul pe care scopul urmărit de un studiu îl are asupra evaluării cercetărilor din perspectiva nivelului lor de validitate Aceste informaţii vor fi utile atât în proiectarea cercetărilor viitoare (anticipând posibile probleme cu interpretarea rezultatelor în funcţie de caracteristicile studiului efectuat), cât şi în identificarea punctelor tari şi a punctelor slabe pentru studiile deja efectuate Tabelul Tipuri de validitate (adaptare după Shadish et al , ) Tipuri de validitate Descriere succintă (tipuri de afirmaţii vizate)  Validitate statistică Se referă la: (a) validitatea inferenţelor statistice efectuate (măsura în care au fost evitate erori de tip I sau de tip II în testarea ipotezelor) şi la (b) încrederea în magnitudinea efectului observat  Validitate internă Se referă la validitatea inferenţelor conform cărora relaţia observată între A şi B reflectă situaţia unei relaţii cauzale (în ce măsură putem fi siguri că A îl determină pe B şi nu sunt alte variabile confundate responsabile pentru efectul B)  Validitate de construct Se referă la măsura în care caracteristicile de bază ale studiului (variabile, participanţi etc ) reprezintă operaţionalizări potrivite pentru a surprinde constructele teoretice vizate  Validitate externă Se referă la măsura în care rezultatele obţinute pot fi generalizate pe alţi participanţi, alt context de cercetare sau alte instrumente de cercetare ce se referă la aceleaşi constructe Cu alte cuvinte se referă la gradul de generalizare a rezultatelor (aceleaşi rezultate ar fi obţinute în alte studii similare)   Validitatea statistică În limbaj simplu, această formă de validitate este valabilă pentru orice tip de studiu care utilizează o metodologie cantitativă şi îndeosebi pentru cele care apelează la formularea şi testarea unor ipoteze de cercetare (de exemplu, studii având un scop descriptiv-analitic) Mai concret, validitatea statistică are în vedere valoarea de adevăr a inferenţelor legate de: (a) măsura în care rezultatul semnificativ sau nesemnificativ statistic este unul corect (evitarea erorilor de tip I sau II, aspect dependent de puterea statistică a studiului); (b) măsura în care mărimea efectului observat în studiu este corect apreciată (efectul nu este supra- sau subestimat, respectiv încrederea în valoarea obţinută) Dintre multiplele riscuri care pot afecta validitatea statistică se distinge îndeosebi situaţia unei puteri statistice scăzute de testare a ipotezelor Puterea statistică scăzută reduce probabilitatea de a obţine rezultate semnificative statistic, când în realitate ar exista un asemenea efect, situaţie cunoscută sub numele de eroare de tip II Puterea statistică scăzută poate fi cauzată de o multitudine de factori (vezi Sava / ), dintre care cel mai cunoscut este numărul insuficient de participanţi cuprinşi în studiu Pentru a creşte puterea statistică a studiului, pe lângă creşterea volumului eşantionului studiat, se poate apela la măsuri de ordin metodologic precum: (a) utilizarea unui design intragrup în locul unuia de tip intergrup; (b) preferinţa, în cazul studiilor comparative, pentru designuri paralele cu mai mult de două grupe; (c) apelul la studii randomizate stratificate (randomized blocked design) în locul studiilor randomizate complet (completely randomized design) pentru a reduce eterogenitatea participanţilor comparaţi, cu condiţia ca variabila utilizată pentru stratificare/potrivire să fie una care corelează cu variabila dependentă; (d) utilizarea unor designuri cu număr egal de subiecţi în celulele experimentale etc (Shadish et al , ; Sava, / ) Pe lângă măsurile de ordin metodologic, trebuie avută grijă şi de aspectele statistice Tabelul conţine o sinteză a celor mai des întâlnite riscuri în cazul validităţii statistice, atât prin impactul pe care îl au asupra puterii statistice (scad puterea statistică), cât şi prin riscul de distorsiune legat de magnitudinea efectului observat (de exemplu, subestimarea efectului) Tabelul Riscuri privitoare la validitatea statistică Riscuri privitoare la validitatea statistică prin impactul lor asupra puterii statistice şi a acurateţei magnitudinii efectului Restricţia de amplitudine Exemplificare: Într-un studiu ce vizează relaţia dintre conştiinciozitate şi performanţa angajaţilor din spital se observă absenţa corelaţiei dintre cele două variabile La o analiză mai atentă se observă restricţii de amplitudine în cazul ambelor variabile De exemplu, deşi scala de măsurare a conştiinciozităţii lua valori între (nivel foarte scăzut) şi (nivel extrem de ridicat al conştiinciozităţii), rezultatele colectate de la participanţi au conţinut scoruri cuprinse între şi puncte, astfel că toţi subiecţii testaţi au un nivel mediu superior al conştiinciozităţii) În mod similar, deşi existau trepte de clasificare a performanţei (de la [mult sub aşteptări] la [mult peste aşteptări]) s-a constatat că peste % dintre participanţi au primit calificative de sau şi niciunul dintre candidaţi nu a primit un scor de sau O astfel de situaţie, în care există o variabilitate scăzută a scorurilor, poartă numele de restricţie de amplitudine şi se soldează cu o diminuare puternică a indicatorului statistic calculat (de exemplu, coeficienţi scăzuţi de corelaţie), fapt ce contribuie la apariţia unui risc crescut de a comite o eroare de tip II, respectiv la subestimarea legăturii dintre variabile Efectul negativ apare atunci când una sau amândouă dintre variabilele analizate suferă de restricţie de amplitudine Tot în cadrul restricţiei de amplitudine aş aminti despre efectul de podea (floor effect), respectiv de tavan (ceiling effect) O ilustrare a efectului de tavan ar fi propunerea de a testa eficienţa unei metode noi de predare a matematicii faţă de metoda clasică la două clase speciale de matematică (cu un nivel mediu al performanţei la matematică la pretest de , în clasa A, respectiv de , în clasa B) Chiar dacă metoda ar fi una benefică, nu există un spaţiu mare de creştere, astfel încât o posibilă creştere cu de sutimi (de la , la , ) ar fi insuficientă pentru a obţine rezultate semnificative statistic, în ipoteza menţinerii aceluiaşi scor de , pentru clasa B) Dacă nivelul de la care s-ar fi pornit ar fi fost unul mai scăzut (de exemplu, o medie de , ), ar fi fost posibilă o creştere mai mare după implementarea noii metode (de exemplu, de , puncte), suficientă pentru a conduce, de această dată, la diferenţe semnificative între grupe Efectul de podea se referă la o situaţie opusă De exemplu, într-un studiu se urmăreşte eficienţa unei tehnici de diminuare a agresivităţii, testată pe participanţi cu agresivitate scăzută (marja de scădere este prea mică pentru a sesiza efectul) Consistenţa internă scăzută Exemplificare: Într-un studiu se compară dacă există diferenţe între grupul experimental şi lotul de control cu privire la nivelul anxietăţii sociale Această variabilă a fost măsurată printr-o scală a cărei consistenţă internă este scăzută (alfa Cronbach fiind , ) Restul aspectelor implicate în cercetare au fost implementate corect Situaţiile în care măsurătorile esenţiale pentru testarea ipotezei (cum este cazul VD în ipoteze ce vizează comparaţii între grupe) au niveluri scăzute ale consistenţei interne, ne îndeamnă să fim extrem de precauţi şi să avem o încredere scăzută în acurateţea scorurilor obţinute, din cauza erorii de măsurare ridicate Din punct de vedere statistic, situaţia conduce la creşterea riscului de apariţie a erorii de tip II şi la subestimarea legăturii dintre variabile Încălcarea asumpţiilor unui test statistic Exemplificare: Într-un studiu se urmăreşte dacă există o legătură între venitul lunar al participanţilor (exprimat în lei) şi atitudinea oamenilor faţă de demersul de suspendare a preşedintelui Traian Băsescu evaluată printr-o scală Likert în trepte ( – total împotrivă, – sprijin total) Datele colectate de la de participanţi (deşi acoperă întreaga plajă de răspunsuri pentru a evita restricţia de amplitudine), indică faptul că cele două variabile au o distribuţie puternic asimetrică (de exemplu, % dintre participanţi au declarat venituri până în lei net, iar atitudinea privind demersul de suspendare era mai degrabă favorabilă, media fiind plasată la , în scala de puncte) În exemplul descris, corelaţia calculată pe aceste date brute va fi atenuată, conducând la efecte similare cu cele menţionate în primele două situaţii de mai sus Acest caz ilustrativ este numai unul din zecile de exemple posibile cu privire la situaţia de încălcare a asumpţiilor asociate unui anumit test statistic De exemplu, în cazul corelaţiei Pearson, una dintre cele mai utilizate tehnici statistice, între asumpţiile de bază pentru a ajunge la un rezultat corect se află: (a) existenţa unei relaţii liniare între variabile; (b) aspectul homoscedastic al asocierii (omogenitatea relaţiei dintre variabile); (c) absenţa devierilor grave de la cazul unei distribuţii normale pentru variabilele analizate; (d) absenţa cazurilor extreme (outliers) Pentru mai multe detalii despre acest subiect, vezi Sava ( / ) Aplicarea unui test statistic prin ignorarea asumpţiilor (condiţiilor necesare aplicării acestuia) creşte riscul de a comite atât erori de tip I, cât şi erori de tip II, în funcţie de problema ignorată Soluţia pentru această problemă constă fie în corectarea problemelor respective acolo unde este posibil (de exemplu, transformarea scorurilor brute pentru a ameliora problemele de distribuţie anormală – vezi partea de final a capitolului în Sava, / ), fie în aplicarea altor tehnici statistice Aglutinarea datelor Exemplificare: Într-un studiu privind relaţia dintre nivelul de extravertire şi nevoia de senzaţii tari sunt colectate date numerice despre extraversiune printr-o scală de profil ce permite amplitudini ale scorurilor între şi Deşi ar fi putut testa direct ipoteza vizată, cercetătorul decide să împartă participanţii testaţi în introvertiţi, respectiv extravertiţi, în baza mediei (cei cu scoruri sub medie fiind consideraţi introvertiţi, iar cei cu scoruri peste medie, extravertiţi) Acest gen de transformări, alături de alte variante de aglutinare (de exemplu, realizarea analizelor statistice nu pe baza scorurilor brute, ci pe baza scorului clasei obţinut în baza unui etalon – celebră fiind etalonarea în clase: de la – foarte scăzut, la – foarte ridicat) nu sunt indicate deoarece se pierde o informaţie esenţială, ce poate conduce la distorsionarea rezultatelor şi la efecte specifice restricţiei de amplitudine De exemplu, dihotomia rezultată în baza unui examen – admişi şi respinşi – pierde din vedere diferenţele intragrup (există o distanţă calitativă mai mare între un individ admis cu , faţă de un coleg notat cu , , decât faţă de un alt coleg din celălalt grup, al respinşilor, dar notat cu , ) Shadish et al ( ) tratează această situaţie ca un caz special al restricţiei de amplitudine Raportarea selectivă a rezultatelor Exemplificare: Într-un studiu ce urmăreşte să identifice dovezi cu privire la validitatea predictivă a unei probe de personalitate construite pe modelul Big-Five sunt analizate corelaţiile dintre cele dimensiuni de personalitate şi un set de de comportamente (câte asociate fiecărei dimensiuni, notate de la [deloc] la [frecvent]) În urma prelucrării statistice a rezultatelor, se constată că doar în cazuri din cele de comportamente, rezultatele indică asocieri semnificative cu dimensiunile respective în direcţia aşteptată În redactarea articolului, cercetătorul ia decizia de a include doar de comportamente (câte pentru fiecare dimensiune, între care se regăsesc toate cele pentru care s-au obţinut asocieri semnificative statistic), ignorându-le pe celelalte de comportamente, al căror rezultat era nesemnificativ statistic În principiu, limitarea la prezentarea numai a acelor rezultate care spun o poveste interesantă este o practică încurajată chiar de editorii revistelor de specialitate, din lipsă de spaţiu editorial Cu toate acestea, eliminarea selectivă a rezultatelor care nu convin distorsionează clar concluziile ce pot fi trase din studiu Prezentarea tuturor rezultatelor obţinute ar fi preferabilă pentru a ne forma o impresie realistă, corectă, asupra rezultatelor obţinute, dar şi pentru a aprecia riscul de apariţie a erorii setului de comparaţii (vezi discuţia despre acest tip de eroare la începutul capitolului din Sava, / ) pentru a aprecia care este probabilitatea de a obţine din întâmplare rezultate semnificative statistic, în contextul în care doar % dintre comportamente evaluate au fost asociate unui rezultat semnificativ statistic Dacă prezentarea tuturor rezultatelor nu este posibilă din motive editoriale, preferabil ar fi să se apeleze la strategii complementare De exemplu, dacă fiecare dimensiune de personalitate era asociată cu un set de de comportamente, se poate pune accent pe prezentarea rezultatelor dintre relaţia dintre dimensiunea respectivă şi un scor compozit (global) al comportamentelor, cum ar fi media comportamentelor sau scorul factorial obţinut în urma includerii acestora într-o analiză factorială (a componentelor principale) Un avantaj suplimentar al acestei decizii este evitarea cazurilor de restricţie de amplitudine (de exemplu, în cazul însumării celor de comportamente rezultatul variabilei în cauză variază teoretic între şi , în timp ce în analizele bazate pe fiecare comportament în parte, variază teoretic doar între şi ) Eterogenitate la nivel intragrupal Exemplificare: Într-un studiu interesat de stabilirea eficienţei unui program de slăbire cu ajutorul unor exerciţii de imagerie mentală, nu s-au sesizat diferenţe semnificative între grupul experimental (m = kg, as = kg) şi grupul de control (m = kg, as = kg) În schimb, un alt studiu pe aceeaşi temă identifică diferenţe semnificative statistic, sprijinind eficienţa intervenţiei (m = kg, as = kg în grupul experimental, respectiv m = kg şi as = kg în grupul de control) Deşi diferenţa dintre mediile celor două grupe este aceeaşi în cele două studii, rezultatele sunt diferite! Eşecul primului studiu de a găsi diferenţe semnificative statistic este determinat de o eterogenitatea prea mare a participanţilor din grupele comparate, fapt reflectat prin niveluri ridicate ale abaterilor standard Astfel, este mai simplu de detectat o diferenţă de kg între mediile celor două grupe dacă acestea sunt alcătuite din indivizi relativ omogeni (de exemplu, cântărind între şi de kg) decât din indivizi cu o greutate eterogenă (de exemplu, cântărind între şi de kg) Morala: aşa cum se vorbeşte popular despre un colesterol bun şi unul rău, la fel am putea afirma în cazul împrăştierii datelor Aceasta poate fi benefică (în studii corelaţionale sau dacă vorbim despre dispersia intergrup – diferenţele dintre grupe) sau nocivă pentru validitatea statistică a studiului (cazul dispersiei intragrup – diferenţe mari între indivizii cuprinşi în acelaşi grup) Eterogenitatea poate viza, fie variabila dependentă, fie variabile cu potenţial confundat, fie chiar modalităţile variabilei independente, cum este cazul implementării unei intervenţii nestandardizate Apelul la tehnici statistice inadecvate Exemplificare: Într-un studiu s-a urmărit dacă există o asociere între nivelul de inteligenţă (operaţionalizat prin scorul IQ) şi venitul lunar (operaţionalizat în lei net/lună) Pentru aceasta, cercetătorul a apelat la tehnica hi pătrat al gradului de omogenitate şi a concluzionat că nu există o asociere semnificativă statistic Am lăsat la final, poate cel mai evident risc privitor la validitatea statistică, aceea de a aplica o tehnică statistică greşită (nepotrivită), în cazul descris tehnica corectă fiind coeficientul de corelaţie lineară Bravais-Pearson Deşi asemenea cazuri sunt extrem de rare în literatura de specialitate publicată în reviste cu prestigiu internaţional, am amintit de aceast risc pentru că, din păcate, sunt încă întâlnite ocazional în România, inclusiv în rândul unor lucrări de doctorat sau al unor articole publicate în reviste de specialitate din ţară Validitatea internă Demonstrarea din punct de vedere statistic a unei asocieri între două variabile de interes este o condiţie insuficientă pentru a putea infera relaţii cauzale Cu alte cuvinte, nu orice corelaţie semnificativă statistic este un rezultat al prezenţei unei relaţii de tip cauză-efect Pentru a demonstra existenţa unei asemenea relaţii cauzale, (a) pe lângă demonstrarea unei asocieri semnificative statistic, (b) ar trebui să se constate că modificările în variabila cauză precedă temporal modificările observate în variabila efect, (c) în condiţiile în care sunt eliminate alte explicaţii alternative care ar putea fi responsabile pentru legătura respectivă (Shadish et al , ) Dacă problema obţinerii unui indicator precis pentru relaţia statistică dintre cele două variabile este una de validitate statistică, iar aspectul temporalităţii (ordinea în apariţia modificărilor) poate fi obţinut destul de simplu prin design sau prin analiză logică , problema eliminării explicaţiilor alternative pentru a păstra doar explicaţia cauzală drept sursă a legăturii dintre variabile este o problemă de validitate internă De multe ori este posibil ca demersul statistic să fie excelent realizat, însă să existe erori în raţionamentele cauzale utilizate pentru acest lucru Pentru a ilustra această stare de fapt voi apela la un studiu cvasiexperimental ipotetic cu design pretest-posttest, fără grup de control Într-o iarnă, un cercetător este interesat să propună un program bazat pe exerciţii Yoga pentru a creşte imunitatea organismului (operaţionalizat prin diminuarea numărului de răceli) Pentru aceasta apelează la un lot de de voluntari pe care îi învaţă şi îi monitorizează timp de şase luni în practicarea exerciţiilor Yoga Din punct de vedere statistic, cercetătorul constată un număr semnificativ mai redus de răceli în ultima lună de monitorizare a exerciţiilor comparativ cu situaţia iniţială, ce viza frecvenţa răcelilor în luna premergătoare începerii programului de antrenament Este acest rezultat suficient pentru a valida inferenţa cercetătorului, că prin antrenament Yoga se reduc problemele de sănătate, că exerciţiile sunt benefice pentru imunitatea organismului? Răspunsul, din perspectiva validităţii interne a acestui studiu, este desigur unul negativ atâta timp cât pot fi oferite explicaţii alternative plauzibile pentru rezultatul obţinut De pildă, o explicaţia alternativă pentru diminuarea numărului de răceli poate fi dată de aspectul sezonier al epidemiilor de răceală şi gripă (mai des întâlnite iarna – momentul evaluării pretest, decât vara – momentul evaluării posttest) O altă explicaţie posibilă vizează alimentaţia Este posibil ca odată cu practicarea exerciţiilor Yoga, participanţii să facă schimbări în tipul de alimentaţie folosit şi să înceapă să mănânce mai sănătos Prin urmare, ameliorarea observată la nivelul frecvenţei îmbolnăvirilor poate fi cauzată de noul regimul alimentar sănătos şi nu de exerciţiile Yoga De asemenea, rezultatul poate fi o consecinţă a distorsiunii în selecţia participanţilor Este foarte posibil ca participanţii care au acceptat să fie voluntari în acest studiu cu o durată de şase luni să înceapă să manifeste o preocupare deosebită pentru sănătatea lor, ca urmare a unui istoric personal asociat unor îmbolnăviri frecvente De aceea este posibil să acorde mai multă grijă menţinerii sănătăţii (de exemplu, prin consum zilnic de vitamina C, alimentaţie variată, program regulat de somn etc ), iar această modificare să fie cauza diminuării frecvenţei răcelilor înregistrate Problema celei de-a treia variabile Aceste exemple subliniază un element comun şi esenţial pentru problematica validităţii interne a unui studiu, denumită generic de Brewer ( ) drept „problema celei de-a treia variabile” şi fiind sursa reală a relaţiei observate dintre VI şi VD Deşi, în principiu, validitatea internă ar trebui să fie o problemă specifică doar pentru studiile care urmăresc un obiectiv de tip cauzal (cele longitudinale, cele cvasiexperimentale şi cele experimentale), ea poate fi adresată şi în alte tipuri de studii, dacă cercetătorii fac inferenţe de natură cauzală cu privire la rezultatele obţinute Bunăoară, prezentarea datelor provizorii pentru recensământul din şi discursul public însoţitor pentru a explica rezultatele obţinute constituie o sursă bogată de discuţie din perspectiva celei de-a treia variabile Spre exemplu, s-a observat că există o asociere între judeţele care au cunoscut cea mai mare scădere demografică faţă de recensământul din şi existenţa unor condiţii igienice adecvate (cum ar existenţa unei băi în locuinţă) Astfel, în judeţele a căror populaţie a scăzut cel mai mult se observă un procent mai scăzut de gospodării dotate cu baie în casă Din punct de vedere logic, este puţin probabil ca această asociere să indice o relaţie cauzală între cele două Mai mult, din punct de vedere metodologic este imposibil să fie valide asemenea inferenţe cauzale, fiind vorba de un studiu descriptiv transversal, inadecvat pentru a răspunde la obiective de tip cauzal (deoarece nu poate adresa condiţiile b şi c necesare pentru a considera o relaţie dintre variabile ca fiind una cauzală) Desigur, prin implicarea în ecuaţie a altor variabile este posibil să se ofere unele explicaţii (provizorii) De exemplu, este posibil ca ambele variabile să reprezinte doar efecte ale unei cauze comune Aceasta ar putea fi un nivel mai mare de sărăcie în judeţele respective sau un procent mai ridicat al populaţiei cu rezidenţă în mediul rural etc Pentru că atât sărăcia, cât şi rezidenţa în mediul rural pot fi facilitatori ai existenţei unor băi în afara locuinţei şi ai mobilităţii demografice Acest tip de relaţie, cum ar fi cea dintre pierderea populaţiei din judeţe şi absenţa băilor în locuinţă poartă denumirea în statistică de legătură falsă (spurious correlation), fiind prezentată în partea dreaptă a figurii Complexitatea problemei celei de-a treia variabile este descrisă în figura De exemplu, dacă ne raportăm la partea stângă a figurii şi dacă notăm cu X antrenamentul Yoga, cu Y frecvenţa răcelilor şi cu C alimentaţia sănătoasă, putem observa că inferenţa „Yoga ajută la diminuarea frecvenţei răcelilor” nu reprezintă o cauza reală, deşi statistic poate exista o legătură între ele Se ajunge la această afirmaţie eronată, pentru simplul fapt că omitem din analiză asocierea dintre Yoga şi alimentaţia sănătoasă, aceasta din urmă fiind cauza probabilă pentru îmbunătăţirea stării de sănătate În această situaţie vorbim tot despre existenţa unei legături false între X şi Y, determinate de prezenţa unei a treia variabile C, care joacă rolul unei variabile confundate  Figura Situaţia unor corelaţii false Teoretic, soluţia metodologică pentru situaţia corelaţiilor false ar fi aceea de a varia nivelul variabilei independente şi a urmări efectul acesteia asupra variabilei dependente, în contextul în care s-ar controla (ţine constantă influenţa) nivelul variabilei terţe (confundate) Pe lângă problematica corelaţiilor false, în cadrul discuţiei despre cea de-a treia variabilă pot fi aduse în discuţie relaţiile de mediere, respectiv de moderare Păstrând în minte exemplul utilizării exerciţiilor Yoga pentru a reduce frecvenţa răcelilor, este posibil de luat în calcul un alt scenariu interpretativ De exemplu, este posibil ca între practicarea Yoga şi regimul alimentar sănătos să nu existe doar o relaţie simplă de asociere (o parte însemnată dintre practicanţii Yoga mănâncă sănătos şi se confundă efectele determinate de acestea asupra unei variabile terţe), ci să existe o relaţie cauzală în sine (studii experimentale bine controlate, în care se constată că practicanţii Yoga, spre deosebire de voluntarii aflaţi pe lisa de aşteptare pentru a începe o formare în Yoga, mănâncă mai sănătos) În acest caz, lanţul cauzal devine următorul: practicarea Yoga contribuie la îmbunătăţirea regimului alimentar al practicanţilor, iar un regim alimentar corespunzător diminuează problemele de sănătate Într-un asemenea scenariu, deşi se poate spune că exerciţiile Yoga constituie o cauză indirectă a reducerii frecvenţei răcelilor, explicaţia pentru acest lucru nu vizează exerciţiile fizice în sine, ci un efect al filosofiei Yoga, regimul alimentar sănătos Gradul de validitate al unui asemenea rezultat ipotetic este apreciat diferit Din punctul de vedere al unui studiu care urmăreşte un obiectiv cauzal-descriptiv, legătura dintre practicarea Yoga şi ameliorarea stării de sănătate ar fi o inferenţă validă, pentru că în acest caz nu contează şi validarea explicaţiei pentru relaţia cauzală constatată, ci numai validarea existenţei relaţiei cauzale În schimb, din perspectiva unui studiu care urmăreşte un obiectiv cauzal-explicativ, inferenţa ar fi validă doar în contextul menţionării întregului lanţ cauzal şi a existenţei unui sprijin empiric pentru aceasta prin datele colectate În această situaţie, suntem interesaţi atât de validitatea inferenţelor cu privire la relaţia cauzală în sine, cât şi de validitatea inferenţelor cu privire la explicaţia găsită pentru relaţia cauzală respectivă  Figura Cazul unei relaţii de mediere (stânga), respectiv al relaţiei de moderare (dreapta) În sfârşit, o relaţie cauzală poate fi înţeleasă greşit şi în situaţia în care cea de-a treia variabilă joacă un rol moderator extrem Prin variabilă moderatoare se înţelege acea variabilă care afectează intensitatea relaţiei dintre două variabile În cazuri extreme se poate ajunge la situaţia ciudată de a se inversa chiar efectul observat De exemplu, impactul pe care muzica clasică îl are asupra relaxării psihice este moderat de nivelul de educaţie sau de modelul cultural adoptat Pentru persoane cu studii superioare, cu un nivel ridicat de cultură generală este foarte probabil ca muzica clasică să faciliteze relaxarea În schimb, pentru persoane cu un nivel de şcolarizare scăzut, proveniţi dintr-un mediu cultural în care se preferă ascultarea de manele, există probabilitatea ca muzica clasică nu numai să nu funcţioneze în a induce relaxare, ci chiar să conducă la un efect invers, de creştere a nivelului de excitare (iritare, încordare) Dacă studiul s-ar derula pe participanţi eterogeni, aparţinând ambelor culturi, s-ar putea ca relaţia cauzală să treacă neobservată, cele două direcţii anulându-se reciproc În consecinţă, este posibil ca ignorarea unei variabile terţe cu rol moderator să conducă la concluzii distorsionate cu privire la relaţia cauzală dintre variabilele asupra cărora se produce efectul de moderare Problematica variabilelor confundate este esenţială din perspectiva gradului de validitate al inferenţelor de tip cauzal Tabelul conţine cele mai relevante riscuri care au drept cauză impactul variabilelor confundate asupra VD (Shadish et al , ; Cook şi Campbell, ) Tabelul Riscuri privitoare la validitatea internă Istoricul Exemplificare: Într-un studiu experimental sunt comparate două grupe de elevi de gimnaziu, distribuiţi aleatoriu, fie în grupa experimentală care urmează un program de consiliere de tip peer to peer (consiliere colegială), fie în grupa de control (lista de aşteptare) Scopul studiului este de a stabili eficienţa consilierii colegiale în prevenirea fumatului Pe durata derulării experimentului, şcoala din care fac parte elevii din studiu este selectată într-un program naţional educativ despre consecinţele negative ale consumului de alcool şi tutun La finalul derulării intervenţiei nu sunt identificate diferenţe semnificative statistic între cele două grupe Acest tip de risc se referă la orice tip de eveniment neplanificat care afectează evoluţia variabilei dependente, astfel încât nu se poate aprecia cu certitudine dacă efectul observat este datorat intervenţiei dorite (consilierii colegiale) sau evenimentului (istoricului) neplanificat (programul educaţional cu rol informativ) Pentru a evita asemenea situaţii, se recomandă includerea în formularul de consimţire a unei solicitări exprese ca, în cazul în care acceptă să participe în studiu, să nu urmeze alte tratamente alternative Aspectele de istoric însă pot privi orice situaţie apărută pe durata implementării intervenţiei, inclusiv: (a) situaţii cu impact emoţional major asupra individului cuprins în studiu (cum ar fi situaţiile de deces în familie sau aflarea faptului că suferă de o boală gravă, când intervenţia este menită să reducă depresia); (b) evenimente promovate intens în mass-media (rata scăzută de promovabilitate la bacalaureat în mijlocul unui studiu adresat elevilor de liceu, care îşi propune să testeze eficienţa unei noi metode de învăţare) etc În sfârşit, deşi când ne referim la istoric, avem în vedere un impact generalizat asupra tuturor participanţilor la studiu, pot fi analizate şi situaţii individuale, pentru a decide dacă individul poate fi păstrat ca subiect în studiu (de exemplu, se îmbolnăveşte şi nu poate participa decât la % dintre şedinţele planificate) Soluţii uzuale: Utilizarea unui grup de control (evenimentele cu caracter public vor afecta la fel de mult grupul experimental şi pe cel de control) şi debriefing sau interviuri individuale efectuate la final, după caz (pentru a detecta situaţii încadrabile ca istoric, la nivel individual) Maturarea Exemplificare: Într-un studiu cvasiexperimental de tip pretest-posttest fără grup de control au fost urmăriţi de indivizi ce sufereau de oboseală cronică Aceştia au fost testaţi cu privire la nivelul lor de oboseală atât înainte, cât şi după derularea unui program de antrenare a gândirii pozitive, derulat pe o perioadă de şase săptămâni La finalul intervenţiei se observă o scădere semnificativă statistic a nivelului de oboseală Acest tip de risc se referă la faptul că unele dintre evenimentele studiate se pot ameliora de la sine Astfel, multe tulburări se pot remite spontan De asemenea, în anumite situaţii, deficienţele se corectează de la sine odată cu maturizarea sistemului nervos central (vezi diminuarea simptomatologiei asociate enurezisului sau deficitului de atenţie etc , odată cu înaintarea în vârstă) La fel de adevărat este faptul că, în cazul situaţiilor cu o evoluţie ciclică (sezonieră), se poate ajunge şi la reversul situaţiei, acelea de a subestima efectul intervenţiei Prin urmare, problema cu acest tip de risc este faptul că nu vom putea şti cu certitudine dacă modificările sunt cauzate de intervenţia urmărită sau sunt o consecinţă a maturării Pentru a elimina această risc este imperios să se utilizeze un grup de control care să nu beneficieze de intervenţie Acest tip de risc apare frecvent în studiile de psihologia dezvoltării, îndeosebi la copiii de vârste mici, unde inclusiv cei din grupul de control au multe achiziţii psihice într-un interval scurt de timp Soluţii uzuale: Utilizarea unui grup de control echivalent ca vârstă sau alte caracteristici relevante pentru maturare (prin această soluţie, maturarea va afecta la fel de mult grupul experimental şi pe cel de control, fiind controlat astfel impactul maturării asupra VD) Testarea Exemplificare: În cazul în care participanţii la studiu sunt supuşi unor testări repetate (de exemplu, sunt rugaţi să completeze aceeaşi scală de inteligenţă generală de trei ori într-un interval de două luni, în cadrul unui program menit să augmenteze IQ-ul unui individ): există riscul unei distorsiuni prin faptul că, devenind familiari cu proba respectivă au şanse să obţină un punctaj mai bun pe măsură ce repetă testul (prin învăţarea sau reamintirea unor răspunsuri) În acest tip de risc nu se modifică instrumentul, ci raportarea şi modul de răspuns al individului la instrumentul de evaluare utilizat repetat Riscul este activ pentru probe subiective (evaluări prin autoraportare sau heteroraportare), fiind cu atât mai probabilă cu cât există un număr mai mare de repetări, într-un interval mai scurt de timp între şedinţele de evaluare Soluţii uzuale: Utilizarea ca VD a unor măsurători obiective sau extinderea distanţei dintre şedinţele de evaluare Acolo unde există posibilitatea, pot fi utilizate probe paralele Instrumentarea Exemplificare: Participanţii la studiu longitudinal, întins pe o perioadă lungă de timp (de exemplu, ani, cu evaluări de la la ani) sunt examinaţi prin trei scale de inteligenţă diferite (una specifică copiilor preşcolari [ - ani], una specifică elevilor de gimnaziu [ - ani] şi una destinată evaluării adolescenţilor) Scopul studiului este de a evidenţia dacă un program menit să augmenteze IQ-ul unui individ este eficient Rezultatele obţinute la finalul celor ani de urmărire nu identifică diferenţe semnificative statistic între grupul experimental şi cel de control Prin acest tip de risc (specific mai degrabă studiilor longitudinale derulate pe o perioadă mai lungă de timp) ne referim, în principal, la modificări în instrumentele utilizate (de exemplu, proba de măsurare a IQ-ului la ani nu e potrivită pentru a fi utilizată pe subiecţi de ani, deoarece ar fi prea uşoară, prin urmare nediscriminativă) Tot în această categorie intră şi situaţia utilizării unor versiuni diferite ale aceluiaşi test De exemplu, este posibil ca un test să fie revizuit şi actualizat în timp din raţiuni psihometrice sau de modificare a conţinutului conceptului pe care îl vizează Astfel, versiunea aplicată iniţial (la începutul studiului) poate fi diferită de cea revizuită, aplicată la finalul studiului Pentru a evita asemenea situaţii, ar trebui ca instrumentele diferite utilizate să fie testate din perspectiva invarianţei lor metrice Un alt caz de instrumentare apare în cazul utilizării unor metode apreciative (subiective) de cotare, cum ar fi cazul observaţiei De exemplu, poate interveni oboseala care afectează corectitudinea înregistrărilor sau pot fi implicaţi asistenţi de cercetare diferiţi de la un moment la altul al testării, fiecare cu un stil personal de apreciere a evoluţiei participanţilor În mod similar, poate interveni o diminuare a exigenţei în aprecierea subiectivă a comportamentelor, în direcţia aşteptată prin ipoteze, îndeosebi în contextul studiilor transparente, unde nu este posibilă mascarea tipului de intervenţie primită Soluţii uzuale: Stabilirea nivelului de invarianţă dintre instrumente (în cazul probelor standardizate revizuite); apelul la probe standardizate şi/sau obiective; mascarea intervenţiei prin designuri de tip simplu-orb sau dublu-orb (asistenţii de cercetare să cunoască din ce condiţie experimentală face parte individual evaluat) etc Regresia către medie Exemplificare: Într-un studiu efectuat în cadrul unui liceu cu multiple probleme de disciplină, psihologul şcolar aplică un test de măsurare a nivelului de agresivitate, în baza căruia selectează de băieţi – cei care înregistrau cel mai ridicat nivel de agresivitate Cu acordul acestora aplică un program de consiliere bazat pe tehnici comportamentale în scopul reducerii agresivităţii acestora Rezultatul statistic obţinut indică eficienţa programului, nivelul de agresivitate măsurat postintervenţie fiind semnificativ statistic mai scăzut decât la momentul pretestului Acest tip de risc este unul subtil pentru cei mai puţin familiarizaţi cu principiile statisticii Regresia către medie se referă la probabilitatea scăzută ca la o a doua testare să se obţină tot scoruri extreme Astfel, cei cu scoruri foarte mari, vor avea şanse mari să obţină scoruri ceva mai scăzute, iar cei cu scoruri foarte mici, vor avea şanse mari să obţină scoruri ceva mai ridicate decât la pretest Din punctul de vedere al practicianului, acest efect poate fi o mană cerească Astfel, este foarte probabil ca un pacient să apeleze la psihoterapie când nivelul său de distres este unul maxim sau ca o companie să apeleze la serviciile unui consultant atunci când problema „arde” Chiar dacă propunerile practicianului nu sunt unele eficiente, este posibil să se observe o diminuare (e drept nu foarte mare) a intensităţii problemei respective, ceea ce poate induce impresia greşită că soluţiile oferite au ajutat la reducerea gravităţii problemei Soluţii uzuale: În cazul studiilor experimentale ar fi de dorit să se selecteze un număr suficient de mare de persoane cu scoruri extreme (dacă populaţia evaluată este suficient de mare), astfel încât participanţii selectaţi să fie distribuiţi randomizat fie în grupul experimental, fie în cel de control Această măsură ar conduce la egalizarea efectului regresiei către medie în cele două grupe, controlând astfel impactul acestui posibil risc În cazul studiilor cvasiexperimentale fără grup de control, soluţia ar fi ca participanţii selectaţi în studiu să facă parte în număr egal din ambele extreme (cu agresivitate foarte ridicată, respectiv cu agresivitate foarte scăzută) Distorsiunea în selectarea participanţilor Exemplificare: Într-un studiu cvasiexperimental, un consilier familial doreşte să testeze eficienţa tehnicii de respiraţie Lamaze în reducerea durerilor din timpul travaliului naşterii naturale În urma sprijinului logistic primit din partea unei clinici de obstetrică şi ginecologie, consilierul organizează o întâlnire informativă pentru viitoarele mame la care participă de persoane În urma întâlnirii respective recrutează de persoane care s-au arătat interesate şi încântate de metodă şi au fost de acord să participe la un număr de şedinţe destinate deprinderii tehnicii Lamaze Celelalte de persoane care nu au dorit, din diferite motive, să înveţe tehnica respectivă au fost de acord să participe la studiu ca grup de control Problema cu acest tip de risc este că cele două grupuri pot fi diferite încă de la început În acest caz, participantele din grupul experimental au un nivel diferit de motivare şi interes faţă de metoda evaluată comparativ cu grupul de control, iar rezultatul favorabil tehnicii ar putea fi cauzat de acest plus motivaţional şi nu de caracteristicile tehnicii în sine Sau este posibil ca în grupul experimental să fi fost incluse mai multe viitoare mame cu sensibilitate mare la durere (speriate de gândul naşterii naturale), fapt care ar impieta găsirea unor efecte în favoarea eficienţei tehnicii Lamaze, pentru simplul fapt că există diferenţe între cele două grupe în ceea ce priveşte sensibilitatea faţă de durere Riscul apare în orice context în care distribuirea participanţilor în condiţia experimentală alocată nu se face în mod aleatoriu De exemplu, testarea eficienţei unei metode noi de predare comparativ cu cea clasică, în două clase paralele, a V-a A – primind metoda nouă, iar a V-a B – primind metoda clasică, nu poate fi făcută adecvat Eventualele diferenţe sesizate la final pot fi explicate atât prin plusul adus de metoda nouă, cât şi prin diferenţele naturale existente între cele două clase încă înainte de a derula studiului (cum ar fi cazul în care sunt mai mulţi elevi buni în clasa a V-a A decât în clasa a V-a B) Soluţii uzuale: Apelul la studii experimentale, care prin definiţie presupun alocarea randomizată a participanţilor în grupele experimentale (pentru detalii despre implementarea corectă a randomizării, vezi secţiunea ) Retragerea diferenţiată a participanţilor Exemplificare: Un director de programe educaţionale este interesat să observe care dintre cele două discipline facultative disponibile conduce la un grad mai mare de mulţumire faţă de opţiunea avută Astfel, de participanţi la studiu au acceptat să fie distribuiţi randomizat, fie într-un curs de astronomie (N = ), fie într-un curs de astrologie (N = ) La finalul cursului, studenţii au fost chestionaţi cu privire la atitudinea lor faţă de cursul urmat (cât de mult le-a plăcut) Au răspuns la chestionarul aplicat la posttest un număr de de studenţi care au urmat până la final cursul de astronomie şi un număr de de studenţi care au urmat cursul de astrologie Restul studenţilor rămaşi nechestionaţi nu au fost evaluaţi pentru că au renunţat să finalizeze cursul respectiv, din diferite motive Nu au fost identificate diferenţe semnificative statistic între cele două cursuri, ambele părând a fi la fel de atractive Problema ilustrată în exemplul de mai sus este aceea că la final comparaţia s-a făcut numai pe % dintre cei care au urmat astronomie şi pe % dintre cei care au fost alocaţi cursului de astrologie Este foarte posibil ca absenţa diferenţei în atractivitatea celor două cursuri să fie cauzată de faptul că la final au fost testaţi doar cei care considerat utile informaţiile predate Este foarte posibil ca cei % dintre cursanţi care au renunţat să finalizeze cursul de astronomie să fi făcut acest lucru pentru că nu au fost atraşi de disciplina respectivă Dacă ar fi rămas în studiu până la evaluarea finală, este probabil că balanţa s-ar fi înclinat către o mai mare atractivitate pentru cursul de astrologie De aceea, compararea performanţei înregistrate la nivel de postintervenţie între două grupe cu un nivel diferit de pierdere a participanţilor, semnifică a compara două grupe care nu mai sunt echivalente, în pofida randomizării iniţiale Pe lângă pierderea diferenţiată a participanţilor (în limba engleză sunt utilizaţi doi termeni: attrition sau participant mortality), o problemă, dar nu la fel de gravă, o reprezintă pierderea participanţilor în sine (nu se ştie dacă intervenţia ar mai fi fost eficientă dacă am fi păstrat toţi indivizii incluşi iniţial în studiu, inclusiv pe aceia care nu s-au regăsit/nu au perceput utilitatea intervenţiei primite) În domeniul psihoterapiei, un procent de - % de participanţi care renunţă să finalizeze întreg programul convenit poate fi considerat acceptabil, fiind necesar să se ţină seama de acest lucru atunci când se stabileşte mărimea eşantionului utilizat în studiu (fiind incluşi cu - % mai mulţi participanţi decât ar fi necesar) Soluţii uzuale: Utilizarea, acolo unde este posibil acest lucru, a unui grup de control care să primească o intervenţie dovedită a fi eficientă în locul unui lot de control de tipul absenţei intervenţiei sau a listei de aşteptare Tabelul Riscuri privitoare la validitatea internă în funcţie de designul utilizat Rezultat obţinut S Long Studii cvasiexperimentale Studii experimentale  Tip de risc p , ( ) ( ) ( ) ( ) ( ) ( ) ( )  Istoricul* X X + + – – – – –  Maturarea* X  + + – – – – –  Testarea* X X + + – – – – –  Instrumentarea X X + + – ? – – –  Regresia către medie X  – ? – – – – –  Selecţia distorsionată X X – – + – – – –  Pierderea (diferită) X X + + + + + ? –  Legendă: p , studiul conclude că intervenţia nu este eficientă * Problema în cazul acestor tipuri de riscuri este dependentă de durata existentă între pretest şi posttest În cazul istoricului şi al maturării, riscul creşte pe măsură ce se scurge mai mult timp între testări În cazul testării, direcţia este una opusă, riscul creşte pe măsură ce timpul dintre testări este mai scurt ( ) – studiu non-experimental longitudinal; ( ) – studiu cvasiexperimental cu pretest/posttest, fără grup de control; ( ) – studiu cvasiexperimental cu pretest/posttest şi grup de control pasiv (nu primeşte nimic); ( ) – studiu cvasiexperimental, designul liniei întrerupte de regresie; ( ) – studiu randomizat (experimental) pretest/posttest, cu grup de control pasiv; ( ) – studiu randomizat pretest/posttest, cu grup de control activ (intervenţie uzuală, intervenţie alternativă); ( ) – studiu randomizat pretest/posttest, cu grup de control activ, cu mascarea intervenţiei primite; X – riscul respectiv, o posibilă explicaţie pentru rezultatul obţinut; + risc important; ? risc posibil, în funcţie de context; – risc absent sau improbabil Tabelul poate fi citit în două modalităţi diferite, prin raportare la coloane (rezultatul obţinut, respectiv tipul de studii) sau prin raportare la linii (tipul de risc) De exemplu, dacă luăm în considerare rezultatul studiului, iar acesta indică ineficienţa intervenţiei (nu există diferenţe semnificative statistic), putem fi siguri că maturarea sau regresia către medie nu constituie riscuri pentru acest rezultat Prin definiţie, acest tip de riscuri conduce la erori de tip I (concluzii că intervenţia este eficientă, deşi nu este adevărat acest lucru, diferenţele semnificative fiind explicate ca urmare a maturării sau a regresiei către medie, acolo unde este cazul) În schimb, dacă rezultatul obţinut indică faptul că intervenţia este una eficientă, observăm că toate tipurile de risc discutate pot interveni activ În mod similar, dacă luăm în considerare tipul de design avut în vedere, de exemplu, studiul din tabelul , reprezentând un design cvasiexperimental cu pretest şi posttest şi cu un grup de control care nu primeşte niciun fel de intervenţie, vom putea desprinde următoarele informaţii legate de riscurile existente Studiul prezintă riscuri majore îndeosebi cu referire la: (a) distorsiunea în selecţie (în absenţa randomizării fiind posibil ca cele două grupe comparate să difere de la nivelul pretestului, cu privire la nivelul VD sau a altor factori cu impact asupra evoluţiei VD); (b) pierderea diferenţiată a participanţilor, ca urmare a: numărului mai mare de participanţii alocaţi grupului de control retraşi comparativ cu cei din grupul experimental, primii fiind nemulţumiţi că nu primesc o intervenţie pentru problema lor; numărului mai mare de participanţi alocaţi în grupul experimental retraşi comparativ cu cei din grupul de control, ca urmare a unei intervenţii ce necesită un efort prelungit sau care are o multitudine de efecte secundare negative Aspecte precum istoricul, maturarea, testarea, instrumentarea şi regresia către medie sunt considerate riscuri improbabile pentru acest tip de design, nu pentru că nu ar fi posibilă apariţia lor, ci pentru că de cele mai multe ori, atunci când ele apar, tind să afecteze la fel de mult ambele grupe din studiu, atât pe cel experimental, cât şi pe cel de control Prin egalizarea efectelor lor (menţinerea constantă a influenţei lor) am putea urmări în continuare dacă diferenţa existentă între grupul experimental (cel care primeşte intervenţia) şi grupul de control (cel care nu primeşte intervenţia) este una semnificativă statistic În sfârşit, în cazul unui design de tip cvasiexperimental precum studiul , care prin definiţie suferă de distorsiunea în selecţia participanţilor, oricând este posibil să apară interacţiuni între acest risc şi celelalte (vezi nota de la pagina ) Tot din analiza pe linii (tipuri de risc) pot fi desprinse o serie de concluzii generale cum ar fi: (a) introducerea unui grup de control reduce foarte mult riscurile de tipul istoricului, maturării, testării, instrumentării sau regresiei către medie prin menţinerea constantă a influenţei acestor factori de risc atât în grupul experimental, cât şi în cel de control; (b) apelul la distribuirea aleatorie a indivizilor în condiţiile experimentale elimină distorsiunea de selecţie, ca posibil risc (cel puţin teoretic, în condiţiile asigurării unui număr suficient de mare de subiecţi incluşi în fiecare condiţie experimentală) Astfel, dacă luăm studiul (probabil cel mai bun design posibil în domeniul psihologiei – un studiu randomizat controlat cu un grup experimental ce beneficiază de o intervenţie inovativă, respectiv un grup de control activ, căruia i se oferă intervenţia standard), vom constata că majoritatea riscurilor privitoare la validitatea internă sunt absente sau improbabile Rămân mai crescute riscurile pentru pierderea diferenţiată a participanţilor (în cazul în care cele două forme de intervenţie nu sunt la fel de atractive pentru subiecţi sau diferă semnificativ în ceea ce priveşte cantitatea de efort şi de resurse, inclusiv de timp, implicate) În încheierea discuţiei despre riscurile privitoare la validitatea internă a unui studiu merită subliniat faptul că toate aspectele menţionate anterior vizează punctul (c) din perspectiva condiţiilor necesare pentru a demonstra o relaţie cauzală: măsurile menite să reducă probabilitatea ca efectul observat să fie cauzat de variabile confundate şi nu de intervenţia urmărită La aceste riscuri se adaugă cel cu privire la ambiguitatea stabilirii cu claritate a relaţiei temporale Astfel, în studiile corelaţionale transversale (în care toate măsurătorile sunt colectate în acelaşi timp) este imposibil de decelat dacă modificările în variabila-cauză precedă modificările la nivelul efectelor observate sau dacă situaţia este una inversă De aceea, numai studiile în care modificările la nivelul presupusei variabile precedă măsurarea efectelor pot fi utile în a adresa întrebări de tip cauzal În această categorie intră studiile experimentale/cvasiexperimentale în care manipularea VI are loc înainte de a măsura impactul la nivelul VD la momentul postintervenţiei Tot aici putem include studiile non-experimentale longitudinale (care presupun mai multe valuri de colectare a datelor – cel puţin trei), situaţie în care putem observa dacă modificări în presupusa variabilă cauză de la momentul T la T precedă temporal şi covariază cu modificările temporale observate în efectul urmărit de la momentul T la T Validitatea de construct Constructele sunt esenţiale pentru funcţionarea oricărei ştiinţe prin cele trei roluri majore pe care le îndeplinesc (Shadish et al , ): (a) de a oferi o semnificaţie şi a facilita interpretarea rezultatelor unui studiu şi integrarea acestora la nivel de teorii; (b) prin implicaţiile sociale, politice sau economice pe care le au, soldate deseori cu modificări terminologice, cum este cazul conceptelor cu potenţial de stigmatizare (termenul „handicapat” fiind înlocuit cu „persoană cu nevoi speciale” etc ); (c) de a facilita la avansarea cunoaşterii (sintagme precum „genomul uman”, „memorie procedurală” etc erau necunoscute acum de ani) Caseta Exemplificarea utilităţii folosirii constructelor (o adaptare după Elmes, Kantowitz şi Roediger III, ) O serie de studii, atât experimentale, cât şi corelaţionale, din domeniul psihologiei transporturilor au evidenţiat mai multe rezultate disparate: (a) şoferii au nevoie de un timp mai mare de reacţie pentru a citi corect turometrul (turaţia motorului lor) pe măsură ce trebuie să vireze mai mult de volan (curbe mai abrupte), traficul este mai dens (sunt mai multe maşini în trafic), iar distanţa faţă de un vehicul periculos este mai mică (în faţa maşinii se află un tir imens, cu încărcătură periculoasă); (b) nu numai timpul necesar citirii turometrului este afectat de cei trei factori menţionaţi, se observă şi o scădere în viteza de manevrare a volanului (steering wheel rate); (c) mai mult, asemenea solicitări au efecte la nivel neurofiziologic, fiind observată o asociere între variabilitatea ritmului cardiac (scade variabilitatea) şi situaţiile de conducere descrise, cum ar fi conducerea maşinii în trafic dens sau în apropierea unor vehicule mari, ce induc un sentiment de nesiguranţă, respectiv în abordarea unor curbe periculoase Dacă ar fi să schiţăm logic relaţia dintre toate aceste variabile specificate am obţine o situaţie precum cea reprezentată în partea de sus a figurii Pentru a face ordine în această reţea de legături şi pentru a simplifica interpretarea tuturor acestor relaţii, cercetătorii pot propune noi constructe care să ajute la o mai bună înţelegere (descriere) a situaţiei analizate şi care să ne permită să facem predicţii cu privire la evoluţia lucrurilor În exemplul prezentat, un astfel de concept ar putea fi cel de nivel de solicitare (workload), care ţine seama de raportul dintre cerinţele mediului extern şi efectele asupra performanţei individului (partea de jos a figurii ) Dacă nivelul de solicitare creşte, se poate ajunge la suprasolicitare, cu consecinţe negative asupra siguranţei în trafic În plus, studii ulterioare pot extinde nivelul de generalizare (aplicabilitate) a unui asemenea construct la alte situaţii decât cele din trafic Acest tip de logică constituie baza oricărui demers din psihologie, încă de la începuturile sale ca ştiinţă (vezi teoriile motivaţionale bazate pe impulsuri şi nevoi pentru a explica diferite comportamente umane) Acest lucru se întâmplă pentru că în psihologie se operează frecvent cu concepte abstracte (cum ar fi credinţele iraţionale, stima de sine, angajamentul organizaţional etc ) pentru a oferi un sens şi a ajuta la o mai bună înţelegere a diferitelor paternuri ale comportamentului uman Spre deosebire însă de începuturile psihologiei, în prezent se acordă o mai mare importanţă cerinţei ca aceste noi constructe formulate în psihologie şi teoriile arondate acestora să fie conectate la rezultatele din alte ştiinţe (de exemplu, să fie sprijinite la un nivel implementaţional [biologic] de analiză) Bunăoară, teoria szondiană a genelor pulsiunilor şi a destinului nu este percepută ca fiind întemeiată pe constructe solide, deoarece prevederile ei sunt lipsite de o fundamentare biologică  Figura Simplificarea înţelegerii şi interpretării realităţii prin introducerea de constructe Aşadar constructele psihologice sunt concepte abstracte inferate din comportamentele observate, pornind de la anumite modele teoretice de funcţionare a proceselor psihice considerate acceptabile la un moment dat (Kerlinger şi Lee, ) De exemplu, concepte precum inteligenţa generală, anxietatea, atribuirea sau nivelul de solicitare nu pot fi văzute, auzite sau atinse în realitate Cu toate acestea, rolul lor este asemenea factorilor din analiza factorială: de a extrage aspecte comune din diferite comportamente şi a oferi o interpretare pentru patternul observat (dacă un individ vorbeşte urât cu alţii, trânteşte uşi, îşi loveşte animalul de companie etc , spunem despre persoana respectivă că este agresivă) Dată fiind importanţa constructelor pentru orice demers de cercetare, dar şi din cauza naturii lor abstracte, bazate pe interpretarea realităţii observate în baza unor modele ipotetice şi de explicare a minţii umane, adresarea aspectelor legate de validitatea de construct este sensibilă, dar esenţială pentru a interpreta corect rezultatele unui studiu Pentru a înţelege mai bine distincţia dintre validitatea statistică, validitatea internă şi validitatea de construct, vom lua în considerare un posibil articol cu titlul: „Un studiu randomizat privind eficienţa psihoterapiei interpersonale la adolescenţii depresivi” Validitatea statistică vizează măsura în care rezultatul statistic obţinut este unul corect (sunt evitate erorile de tip I sau II) Validitatea internă vizează măsura în care legătura observată poate fi privită în termeni cauzali (intervenţia respectivă este cauza pentru modificările observate la nivelul depresiei) Validitatea de construct vizează măsura în care cercetătorul a operaţionalizat corect studiul respectiv În exemplul de mai sus, ar viza întrebări concrete precum: „suntem siguri că intervenţia oferită este corect denumită psihoterapie interpersonală?”; „suntem siguri că măsurătorile variabilei dependente constituie măsurători adecvate ale nivelului de depresie?”; „suntem siguri că participanţii la studiu sunt nominalizaţi corect ca fiind adolescenţi depresivi?” Pelham şi Blanton ( ) au sintetizat memorabil aceste caracteristici ale validităţii de construct spunând că are în vedere măsura în care cercetătorul a reuşit să facă (operaţionalizeze) ceea ce şi-a propus să facă, a spus că a făcut şi ar fi trebuit să facă (how well was done what the researcher meant, said, or should have done) În plus faţă de aceste întrebări, tipice pentru orice tip de studiu empiric, în cazul studiilor care îşi propun un scop cauzal-explicativ (posibil numai prin studii randomizate), validitatea de construct poate contribui la un obiectiv suplimentar, acela de a găsi explicaţii pentru relaţia cauzală (de exemplu, „din ce motiv funcţionează psihoterapia interpersonală în combaterea depresiei?”; „care este explicaţia validă pentru acest rezultat?”) O altă frază memorabilă cu referire la validitatea de construct este oferită de Trochim ( ), parafrazând celebra afirmaţie din justiţie: „jur să spun adevărul, întregul adevăr şi numai adevărul” Conform acestui autor, problema validităţii de construct se referă la măsura în care instrumentul utilizat reflectă „constructul, întregul construct şi numai constructul vizat” Însă, validitatea de construct nu se referă doar la corectitudinea măsurătorilor efectuate (de exemplu, măsurarea depresiei), aşa cum s-ar crede, ci vizează gradul de adecvare în modul de operaţionalizare şi implementare a întregului studiu, referindu-ne aici la participanţi, la contextul cercetării şi la variabilele măsurate în studiu, fie că este vorba de modul în care a fost implementată intervenţia (manipularea VI) sau de efectele observate (VD) Această viziune reprezintă o extindere făcută de Shadish et al ( ), pornind de la modul iniţial de a conceptualiza validitatea de construct (Campbell şi Stanley, ; Cook şi Campbell, ) care se rezuma doar la nivelul de adecvare legat de operaţionalizarea variabilelor din studiu (manipularea experimentală, respectiv operaţionalizarea variabilei dependente sau a altor covariabile măsurate) Totuşi, deşi au trecut mai bine de zece ani de la această extindere a sferei validităţii de construct, numai trei dintre cele patru surse care pot viza validitatea de construct au cunoscut o dezvoltare continuă Este vorba, în primul rând, de păstrarea în prim-plan a preocupărilor pentru modul în care s-a conceput şi efectuat măsurarea variabilelor incluse în studiu (de exemplu, VI şi VD în studiile experimentale), respectiv de discuţia cu privire la validitatea de construct din perspectiva participanţilor incluşi în studiu Luând în calcul această direcţie de dezvoltare, ne vom axa în cele ce urmează numai asupra acestor trei ipostaze importante din perspectiva validităţii de construct Nu în ultimul rând, o precizare importantă pentru studiile experimentale, evidenţiată de Susser, Schwartz, Morabia şi Bromet ( ), este aceea că atât validitatea internă, cât şi cea de construct vizează, în esenţă, identificarea variabilelor confundate Totuşi, în cazul validităţii interne problema se pune în a identifica acele riscuri (variabile confundate) care ar fi condus la rezultate semnificative statistic în absenţa intervenţiei (acţiunii VI), fiind extrinseci intervenţiei (modului de manipulare a VI) Astfel, nu se poate distinge clar dacă intervenţia sau variabila confundată sunt cauza efectului observat În schimb, în cazul validităţii de construct problema este identificarea acelor riscuri care au efect asupra variabilei dependente, dar care fac parte din intervenţie, fiind intrinseci intervenţiei (modului de manipulare a VI) În această situaţie nu se poate distinge clar sursa (explicaţia) relaţiei cauzale obţinute Validitate de construct cu implicaţii la nivelul participanţilor din studiu Fie studiul non-experimental comparativ ce urmăreşte dacă există diferenţe între femeile cu rezidenţa în mediul rural şi cele cu rezidenţa în mediul urban în ceea ce priveşte frecvenţa utilizării prezervativelor Problema cu acest tip de studiu, unde nu intervine niciun fel de manipulare experimentală (deci nu ridică probleme de validitate internă), este legată de dificultăţile în operaţionalizarea participanţilor Astfel, dacă nu sunt luate măsuri de control, este foarte posibil ca cele două loturi să difere şi cu privire la alte caracteristici studiate decât cea menţionată De exemplu, este foarte posibil să existe o proporţie mai mare de femei cu studii superioare în lotul persoanelor din mediu urban decât al celor din mediul rural De asemenea, s-ar putea să existe diferenţe între cele două loturi cu privire la modul în care se raportează comportamental la religie şi la preceptele religioase etc De aceea, în lipsa unor măsuri elementare de control al participanţilor incluşi în studiu, am putea afirma la fel de bine că studiul urmăreşte diferenţele existente cu privire la utilizarea prezervativelor între femei cu studii superioare, care aderă la practicile religioase, şi cele fără studii superioare, care nu aderă la practici religioase De asemenea, chiar dacă controlăm atent potenţiale variabile confundate, definitorii pentru participant, ar trebui acordată mai multă atenţie şi definirii a ceea ce înseamnă persoană cu rezidenţa în mediul rural, respectiv urban De exemplu, poate că un procent de % dintre femeile incluse în lotul cu rezidenţa în mediul urban au mai puţin de un an vechime de când s-au mutat de la sat la oraş Sunt în acest caz ele potrivite (reprezentative) pentru a fi incluse în grupul celor cu rezidenţă în mediu urban? Pentru a evita asemenea situaţii, cea mai bună soluţie ar fi aceea de a oferi definiţii operaţionale pentru ceea ce se înţelege prin femei cu rezidenţa în mediul urban, respectiv în mediul rural Problema validităţii de construct cu privire la participanţii incluşi în studiu este adresată de obicei în studiile randomizate controlate, precizându-se foarte clar ce fel de participanţi au fost eligibili pentru a fi incluşi în studiu şi care sunt criteriile de excludere De exemplu, în studiul efectuat de David et al ( ), care viza efectului terapiei cognitiv-comportamentale asupra adulţilor cu depresie majoră, se stipulează explicit că au fost incluse doar persoanele care: (a) au fost diagnosticate cu depresie majoră după standardele DSM-IV; (b) au obţinut scoruri mai mari sau egale cu la scala de depresie Beck; (c) au obţinut un rezultat de cel puţin sau mai ridicat la scala de depresie Hamilton; (d) şi nu prezintă alte comorbidităţi psihiatrice după DSM-IV De asemenea, au fost excluşi din studiu cei care urmau deja un tratament medicamentos sau psihoterapeutic, precum şi cei cu vârsta sub ani sau cei de peste de ani Prin aceste precizări explicite se poate aprecia mult mai bine măsura în care modul de operaţionalizare asociat participanţilor corespunde constructului teoretic de adulţi suferinzi de depresie majoră Validitate de construct cu implicaţii la nivelul intervenţiei (manipulării VI) În mod firesc, obţinerea unui rezultat semnificativ statistic în cadrul unui studiu experimental constituie un temei puternic pentru ca orice cercetător să considere că intervenţia testată este una eficientă sau că manipularea experimentală a produs efectul dorit Validitatea de construct localizată la nivelul VI urmăreşte gradul de adevăr (încredere) în explicaţiile oferite cu privire la relaţia cauzală demonstrată Ea nu pune în discuţie valoarea de adevăr cu privire la existenţa unei relaţii de tip cauză-efect (în studii experimentale) sau a unei relaţii de asociere (în studii non-experimentale), ci urmăreşte măsura în care explicaţiile psihologice oferite pentru aceste relaţii semnificative statistic au suport empiric De exemplu, în cazul intervenţiilor psihoterapeutice, Corday şi Pion ( ) subliniază faptul că deşi se demonstrează faptul că o intervenţie psihoterapeutică este eficientă (de exemplu, există o relaţie cauzală între expunerea la forma respectivă de psihoterapie şi ameliorarea simptomatologiei depresive), efectul poate fi determinat de alte componente asociate intervenţiei decât cele utilizate ca explicaţie Astfel, eficienţa unei intervenţii este dificil de explicat pentru că efectul poate fi cauzat de: (a) unele variabile confundate nespecifice, intrinseci intervenţiei (cum ar fi expectanţele cercetătorului, efectul placebo etc ); ( ) alte explicaţii plauzibile care nu au fost verificate (explicaţii concurente); ( ) unele cauze necunoscute în situaţia implementării problematice a intervenţiei (ceea ce s-a oferit clienţilor diferă semnificativ de ceea ce ar fi trebuit să li se ofere – aderenţa scăzută la prevederile manualului de intervenţie) De aceea, pentru a ne asigura că interpretarea unei relaţii cauzale este cea corectă, ar trebui să ne asigurăm că cele trei surse menţionate au fost controlate/nu constituie explicaţii plauzibile pentru rezultatul obţinut De aceea, vom discuta în paginile următoare principalele tipuri de probleme (riscuri) la adresa validităţii de construct cu referire specifică la cazul VI prezente în studii experimentale sau cvasiexperimentale Acestea sunt reflectate sintetic în figura  Figura Schiţa principalelor probleme întâmpinate în adresarea validităţii de construct a variabilei independente Complexitatea manipulării VI/complexitatea intervenţiei Printre cele mai subtile ameninţări la validitatea de construct (a modului în care a fost operaţionalizată variabila independentă) se regăseşte complexitatea constructului utilizat Kazdin ( ) descrie succint cazul general al farmacoterapiei, în care grupul experimental (cel care primeşte medicamentul experimental) este comparat cu un grup de control (care nu primeşte nimic), iar rezultatul indică diferenţe semnificative statistic în favoarea grupului experimental Un asemenea rezultat nu ridică probleme din perspectiva validităţii interne (presupunând că privitoare la aceasta au fost evitate) Problema apare atunci când cercetătorul îşi propune să explice rezultatul obţinut, cum ar fi ideea că medicamentul respectiv este eficient în reducerea simptomatologiei depresive, spre exemplu Cele două grupe nu diferă numai la nivelul ingerării posibilei substanţe active Simplu fapt că cei din grupul experimental primesc un tratament poate conduce la aşteptări pozitive din partea participanţilor incluşi în grupul experimental Aceste aşteptări, cunoscute generic sub numele de efectul placebo, pot apărea chiar dacă medicamentul primit nu conţine nicio substanţă activă Efectul apare pentru că pacienţii cred că medicamentul primit îi va face bine, le va ameliora problemele de sănătate Rezultatul este uimitor! Studiile arată faptul că, deşi medicamentele antidepresive ajută la ameliorarea simptomatologiei/recuperare doar în aproximativ % din cazuri, un efect pozitiv se obţine şi în contextul în care se administrează placebo, pentru aproximativ din indivizi aflaţi, fără ştiinţa lor, în acest grup (Agenţia de Cercetare şi Politici de Sănătate Publică din SUA, apud Kazdin, ) În cazul intervenţiilor psihologice, conceptualizarea ideii de placebo se concretizează adesea prin urmărirea unor factori nespecifici, cum ar fi oferirea unor şedinţe de consiliere în care rolul consilierului este mai degrabă unul pasiv, de a oferi informaţii despre problema care necesită intervenţia şi de a asculta problemele avute de individul consiliat Până la urmă, grupul experimental diferă de cel de control, nu numai prin forma de intervenţie primită (de exemplu, coaching cognitiv-comportamental), ci prin însăşi natura sarcinii De exemplu, cei din grupul experimental participă regulat la şedinţe, spre deosebire de cei din grupul de control de tip „absenţa intervenţiei” şi primesc mai multă atenţie din partea echipei de cercetare Participarea la asemenea şedinţe activează în mod diferit resursele psihologice ale indivizilor din grupul experimental faţă de cei din grupul de control, primii având o încredere mai mare că activităţile efectuate ar putea fi în beneficiul lor decât cei din grupul de control Pentru a ne asigura că intervenţia respectivă şi nu efectul placebo este responsabil pentru rezultatul obţinut, ar fi dezirabil ca grupul de control să nu fie unul pasiv, ci să urmeze o intervenţie nespecifică pentru problema respectivă În sfârşit, chiar dacă efectul observat nu este cauzat de efectul placebo, rămâne să se stabilească ce anume din cadrul psihoterapiei a condus la efectul observat Să fie adevărată explicaţia oferită de cercetător (de exemplu, reducerea cogniţiilor iraţionale autodepreciative reduce nivelul depresiei)? Sau ameliorarea este consecinţa altor factori psihoterapeutici precum încrederea ridicată în expertiza terapeutului, consolidarea alianţei terapeutice, modificări ale altor tipuri de cogniţii iraţionale decât cele autodepreciative etc ? Pentru a ne asigura de validitatea explicaţiei oferite este necesar apelul la studii care se focalizează pe identificarea unor mecanisme cauzale (vezi secţiunea ), îndeosebi la studii care manipulează experimental gradientul (cantitatea de exerciţii) menit să conducă la relaţia cauzală observată Aceeaşi problemă a complexităţii VI din perspectiva modului în care a avut loc manipularea experimentală apare şi în alte tipuri de studii experimentale din psihologie, în afara celor care vizează testarea unor intervenţii cu impact aplicativ în domenii diverse (clinic, educaţional, organizaţional etc ) De exemplu, caseta conţine descrierea unei asemenea situaţii în domeniul cercetării fundamentale din psihologia socială Aşadar, o consecinţă frecvent întâlnită în situaţiile care suferă de problema complexităţii constructelor este capacitatea redusă de a oferi explicaţii valide pentru rezultatele obţinute Acestea rămân la stadiul unor discuţii speculative, al unor direcţii viitoare de cercetare Caseta Ilustrarea dificultăţilor de explicare a rezultatelor provenite din studii experimentale (cu validitate internă demonstrată; exemplul – adaptare după Brewer, ) Exemplul ipotetic Ritmurile hip hop induc agresivitatea Este posibil ca, în cadrul unui studiu experimental, participanţii să fie supuşi într-una din cele două condiţii experimentale diferite: (a) să asculte albumele de muzică hip hop ale formaţiilor Paraziţii şi BUG Mafia; (b) să asculte şlagăre muzicale din anii ‘ din repertoriul Angelei Similea, respectiv al Corinei Chiriac Variabila dependentă este reprezentată de o măsură implicită a agresivităţii măsurată prin timpul de reacţie necesar completării unor anagrame (de exemplu, lonag rearanjat devine golan, lăsând la o parte discuţia cu privire la adecvarea acestei operaţionalizări a variabilei dependente din perspectiva validităţii de construct) Rezultatul studiului (fără probleme privind validitatea internă) sprijină existenţa unei relaţii cauzale, nivelul de agresivitate fiind mai ridicat în grupul celor care ascultă hip hop Explicaţia oferită de cercetător pentru acest rezultat vizează ca mecanism explicativ starea de spirit diferită transmisă de cele două genuri muzicale O asemenea explicaţie este însă una pur speculativă, nefiind susţinută prin alte măsuri active în cadrul studiului Acest lucru se întâmplă pentru că există o altă interpretare plauzibilă, aceea că diferenţa la nivel de agresivitate dintre cele două genuri muzicale este dictată de limbajul diferit (de texte), nu de ritmul pieselor Atât timp cât cele două genuri muzicale diferă, atât la nivel de ritm, cât şi de „cuminţenie a textelor” niciuna dintre cele două interpretări nu depăşeşte un nivel speculativ, astfel că inferenţele explicative oferite nu au validitate de construct Desigur, un asemenea experiment ar putea fi îmbunătăţit printr-o simplă manipulare experimentală În locul audierii unor formaţii româneşti (cu texte inteligibile pentru participanţii la studiu) se poate decide să se asculte aceleaşi genuri muzicale în interpretarea unor formaţii japoneze În acest caz, diferenţele la nivel de text dispar, astfel că păstrarea unor diferenţe semnificative la nivelul agresivităţii nu ar mai putea fi explicate prin nivelul diferit de agresivitate prezent în conţinutul textelor Însă problema interpretării ar fi rezolvată doar parţial, dacă alţi cercetători ar deschide o nouă linie de dezbare, exprimându-şi opinia că agresivitatea semnalată şi în muzica hip hop japoneză este transmisă nu prin ritmul melodic, ci prin diferenţe în tonalitatea vocii interpretului (mesajul paraverbal transmis) Exemplul (vezi Brewer, ; Wikipedia, ) Disonanţa cognitivă creşte nivelul de atractivitate În studiul clasic realizat de Aronson şi Mills ( ) li se cere participanţilor la un experiment să discute despre psihologia sexului Pentru a verifica dacă sunt pregătiţi să vorbească despre un asemenea subiect, participanţii au fost împărţiţi aleatoriu în trei grupe Unii dintre participanţi au fost puşi iniţial să citească cu voce tare în faţa celorlalţi cuvinte cu conotaţie sexuală redusă (de exemplu, prostituată, virgină etc ) şi anumite pasaje de text cu acelaşi nivel moderat de conotaţii sexuale Participanţii din al doilea grup au avut aceeaşi sarcină de făcut, doar că de această dată cuvintele şi pasajele citite aveau o conotaţie sexuală puternică (de exemplu, penis, vagin etc ) Subiecţii incluşi în cel de-al treilea grup, cel de control, nu au nicio sarcină de iniţiere în grup Apoi toate grupurile au participat la o discuţie voit plictisitoare (direcţie indusă de către experimentator), cu tema: activitatea sexuală la animale La finalul discuţiei de grup li s-a cerut tuturor să aprecieze cât de mult le-a plăcut grupul ad-hoc creat şi discuţia avută Rezultatele obţinute au arătat că cei care au trecut prin condiţia experimentală cea mai dură (stânjeniţi de pronunţarea cu voce tare a unor cuvinte obscene în faţa unor necunoscuţi) au apreciat cel mai mult grupul de discuţii la care au participat Interpretarea autorilor pentru acest rezultat s-a făcut din perspectiva disonanţei cognitive Astfel, plusul de apreciere în evaluarea grupului din care au făcut parte cei din condiţia experimentală cu conotaţii sexuale puternice a fost pus pe seama efortului suplimentar depus de ei pentru a depăşi starea de disconfort (jenă) Este posibil ca unul dintre gândurile pentru a-şi rezolva disonanţa legată de supliciul prin care au trecut să fi fost: „Până la urmă a meritat situaţia jenantă în care m-am aflat, pentru că grupul este chiar drăguţ” Din nefericire pentru autori, această explicaţie a fost contestată de alţi cercetători, care au oferit o interpretare alternativă plauzibilă Aceasta ar fi că nivelul ridicat de apreciere a grupului de discuţii din partea celor aflaţi în condiţia experimentală cu conotaţii sexuale puternice este un rezultat rezidual al excitării sexuale Cu alte cuvinte, citirea pasajelor respective a condus la o creştere a excitării sexuale, iar acest efect s-a reportat şi în aprecierea calităţii grupului şi a discuţiei de grup Prima explicaţie oferită de autori nu se distinge de explicaţia alternativă din perspectiva suportului empiric, de aceea se poate afirma că interpretarea oferită este una speculativă, lipsită de validitate de construct Studii ulterioare au încercat să rezolve această dilemă (Gerard şi Mathewson, apud Brewer, ) prin eliminarea conotaţiilor sexuale din studiu, dar cu păstrarea unui context nefavorabil de iniţiere în discuţia de grup Astfel, în locul citirii unor cuvinte cu conotaţie sexuală, li s-au aplicat participanţilor din condiţia experimentală adversivă nişte şocuri electrice, ca un test de sensibilitate emoţională În locul discuţiei ulterioare despre sexul la animale, discuţia, derulată tot într-o manieră monotonă, a fost despre copiat şi alte forme de fraudă Rezultatele obţinute din acest studiu au replicat conceptual ideea din cercetarea anterioară Astfel, persoanele din condiţia experimentală care au fost supuse celui mai intens nivel de şoc electric au fost cele care au apreciat cel mai mult grupul şi discuţia de grup Observaţie! Printr-un asemenea demers se replică la nivel conceptual rezultatele studiului anterior şi se elimină varianta evaluării pozitive a grupului ca un efect al reportării excitării sexuale Acest lucru nu înseamnă automat că prima explicaţie este confirmată În acest caz, ca şi în cel al ştiinţei în general, ipotezele nu se confirmă, ci doar pot fi sprijinite până la proba contrarie O astfel de probă contrarie pare fi cazul unui studiu efectuat recent pe porumbei (Singera şi Zentall, ), în care s-a arătat că porumbeii sunt mai încântaţi de recompense dacă acestea sunt primite după situaţii negative Un astfel de rezultat ar elimina explicaţia bazată pe disonanţă cognitivă (dacă asumăm că porumbeii nu raţionalizează şi nu-şi justifică efortul!) În schimb, o altă explicaţie devine plauzibilă pentru toate cele trei studii descrise Ea este bazată pe discrepanţa (distanţa) afectivă dintre starea iniţială percepută negativ şi starea finală pozitivă În limbaj popular, bucuria pare a fi mai mare dacă vine după o stare de agonie (vezi sintagma „de la agonie la extaz”), decât dacă trecerea este de la o stare neutră sau uşor pozitivă la una de bucurie Din acest punct de vedere, se poate spune că această explicaţie are un nivel ridicat al validităţii de construct deoarece: (a) reuşeşte să ofere o explicaţie plauzibilă pentru studiul efectuat pe porumbei şi să elimine totodată celelalte două variante explicative vehiculate; (b) să constituie explicaţii plauzibile în demersul de interpretare a studiilor anterioare Atât studiul bazat pe aplicarea iniţială de şocuri electrice, cât şi cel bazat pe expunerea iniţială la un disconfort social pornesc de la o stare afectivă negativă, nu de la un punct de start neutru Însă, din punct de vedere al consolidării validităţii de construct, demersul de cercetare ar putea continua De exemplu, ar fi utilă demonstrarea interpretării într-o manieră directă, cum ar fi cazul replicării celor două studii derulate pe oameni, însoţită de o verificare a manipulării experimentale Spre exemplu, se poate demonstra că între condiţiile experimentale există diferenţe cu privire la intensitatea percepţiei negative a stării iniţiale, întrebând participanţii cât de bine se simt după sarcina de iniţiere (manipulare confirmată dacă percepţia negativă este mai intensă în condiţia experimentală severă) Această dovadă ar constitui veriga lipsă necesară pentru interpretarea bazată pe discrepanţa afectivă dintre starea iniţială şi starea finală Explicaţia şi-ar schimba statutul dintr-una plauzibilă, dar indirectă (rezultatele mai multor studii fiind interpretabile prin apelul la distanţa afectivă), într-o explicaţie „dovedită”, sprijinită empiric printr-o serie de replicări conceptuale, cu un nivel ridicat al validităţii de construct Subreprezentarea constructului O problemă frecvent întâlnită cu privire la validitatea de construct este aceea a operaţionalizării constructului teoretic printr-o singură variabilă sau printr-un set limitat de stimuli Acest lucru duce la subreprezentarea constructului teoretic, problemă cunoscută în literatura de specialitate ca distorsiunea operaţionalizării singulare (mono-operation bias) Unii cercetători consacraţi în domeniul validităţii unei cercetări o consideră ca fiind cel mai serios risc privitor la validitatea de construct (Cook şi Campbell, ) În sensul ei originar, această distorsiune are în vedere situaţia în care este utilizată o singură modalitate de reprezentare a unui construct, astfel încât nu se poate distinge dacă efectul observat este cauzat de constructul pe care îl reprezintă sau de aspectele particulare (specifice) ale stimulului (metodei respective) – vezi caseta Ulterior, riscul şi-a extins sfera de cuprindere, fiind vizate orice situaţii în care constructul evaluat este operaţionalizat printr-un număr insuficient de stimuli sau de faţete ale constructului ori prin lipsa de reprezentativitate a acestora Caseta Ilustrarea subreprezentării constructului (distorsiunii mono-operaţionale) Exemplu ipotetic Impactul credibilităţii sursei asupra mesajelor cu rol persuasiv Într-un studiu experimental s-a vizat influenţa credibilităţii sursei asupra acceptării unui mesaj persuasiv luând cazul concret al Roşiei Montane şi al beneficiilor economice rezultate în urma începerii exploatării zăcământului aurifer În cele două grupe experimentale utilizate a fost transmis acelaşi mesaj (pentru a controla impactul conţinutului acestuia), fiind însă manipulată sursa (personajul) care se presupune că a formulat mesajul respectiv Primului grup experimental i s-a transmis că este vorba despre o femeie casnică, în vârstă de de ani, mamă a trei copii, care se ocupă în timpul liber de croşetat pentru a face un ban în plus Aceasta a lucrat o vreme la o întreprindere aflată la de km distanţă, dar apoi a renunţat, preferând să se ocupe de treburile gospodăreşti şi de educaţia copiilor, bazându-se financiar doar pe ajutorul social de la stat şi alocaţia copiilor Celui de-al doilea grup i s-a specificat că mesajul este transmis de un analist financiar, doctor în ştiinţe economice cu o temă privind rentabilitatea economică a sectorului minier, bursier Fullbright, având numeroase publicaţii de specialitate privind dezvoltarea economică a regiunilor miniere defavorizate, dar şi o capacitate bună de a comunica mesaje accesibile publicului larg pe înţelesul acestuia Cele două situaţii experimentale diferă, aşadar, prin nivelul diferit de expertiză a personajului despre care se afirmă că este sursa textului persuasiv prezentat Problema cu acest gen de studii este faptul că scenariile prezentate reprezintă cazuri particulare singulare pentru constructele uzitate, fapt ce poate conduce la dificultăţi în explicarea clară a motivelor pentru care s-au înregistrat diferenţe între grupe De exemplu, categoria generală a experţilor economici vizează o multitudine de exemplare diferite De aceea, este posibil ca diferenţele observate să fi fost altele dacă în descrierea celui de-al doilea personaj, înlocuiam sintagma bursier Fullbright, cu aceea de angajat al Gabriel Gold Corporation (compania canadiană cu interese economice directe în exploatarea aurului din zonă) De asemenea, dacă studiul ar fi fost efectuat pe studenţi de la Litere, iar în locul mamei ar fi fost prezentată o tânără absolventă de limbi străine, reîntoarsă pe meleagurile natale, impactul ar fi putut fi altul Soluţia necesară pentru a evita asemenea situaţii este aceea a apelului la un set de cazuri diferite pentru a descrie cele două categorii avute în vedere: fără expertiză economică, respectiv cu o asemenea expertiză Bunăoară, pentru prima condiţie experimentală s-ar apela, în locul unei singure descrieri, la cinci personaje diferite (drept caracteristici demografice, stil de viaţă), dar care împărtăşesc acelaşi atribut (lipsa expertizei în domeniul economic) Acelaşi demers s-ar putea realiza pentru cel de-al doilea grup experimental, apelându-se la cinci personaje diferite, toate cu expertiză în domeniul economic Fiecare participant în acest studiu modificat, ar fi în continuare expus unui singur personaj (sursă), selectat în mod aleatoriu dintre personajele dezvoltate pentru condiţia experimentală de care aparţine Dacă rezultatele indică diferenţe între cele două grupe experimentale în direcţia aşteptată, vom avea o mai mare de încredere în a afirma că nivelul de expertiză al sursei influenţează actul persuadării dincolo de conţinutul mesajului transmis În absenţa acestor exemplare multiple reprezentative pentru acelaşi construct, diferenţele dintre condiţiile experimentale ar putea fi cauzate de alte aspecte specifice care diferenţiază cazurile unice comparate (primul personaj fiind o femeie casnică, cel de-al doilea un bărbat activ în câmpul muncii etc ) O problemă similară cu cea precizată în caseta poate apărea în cazul studiilor randomizate controlate care testează eficienţa unei intervenţii Kazdin ( ) surprinde corect această problemă De exemplu, fie cazul în care se urmăreşte compararea eficienţei intervenţiei A cu cea a intervenţiei B, intervenţia A fiind implementată de doi terapeuţi specialişti în intervenţia A, în timp ce intervenţia B este livrată de un singur specialist Rezultatul obţinut sprijină ipoteza că intervenţia B este mai eficientă decât intervenţia A în diminuarea problemei semnalate Deşi din perspectivă statistică şi a validităţii interne, afirmaţia poate fi validă, există o explicaţie alternativă pentru rezultatul obţinut Este posibil ca diferenţa observată să apară pentru că terapeutul specialist în intervenţia B este un profesionist mai bun decât cei care au implementat intervenţia A Mai mult, chiar dacă ambele tipuri de intervenţie ar fi implementate de acelaşi psihoterapeut (care deţine acreditări atât pentru intervenţia A, cât şi pentru B), este posibil ca acesta să se simtă mai confortabil şi mai eficient într-o anumită formă de psihoterapie Din cauza acestor limite interpretative, se recomandă ca atunci când se doreşte compararea eficienţei unor forme diferite de intervenţie să se apeleze la un număr mai mare de persoane care să implementeze fiecare condiţie experimentală, pentru ca la final să se analizeze măsura în care compararea eficienţei intervenţiilor este moderată de eventuale diferenţe surprinse în calitatea terapeuţilor care au livrat intervenţiile respective Confuzia dintre construct şi modalităţile sale Să ne imaginăm că este testată eficienţa unui program de coaching executiv menit să reducă fluctuaţia de personal Durata întregului program este de ore cumulate cu ocazia a cinci întâlniri faţă în faţă între consultant şi manager Rezultatul obţinut nu sprijină ideea eficienţei acestui program (diferenţele dintre pretest şi posttest fiind nesemnificative statistic) Însă interpretarea corectă în acest caz ar fi una uşor diferită Nu putem afirma că programul de coaching în ansamblul său este unul ineficient, ci că programul de coaching în formatul scurt cu cinci şedinţe (totalizând ore de coaching) este unul ineficient Acest lucru este cu atât mai probabil cu cât un program de coaching mai lung, de exemplu, totalizând de ore, să aibă un nivel de eficienţă demonstrat empiric Acest gen de probleme este frecvent întâlnit în domeniul psihologiei experimentale, în care o importanţă deosebită revine calibrării stimulilor De exemplu, un efect de amorsare semantică (conceptual priming) poate fi constatat dacă stimulul amorsă este prezentat timp de ms înainte de apariţia stimulului-ţintă, în timp ce efectul de amorsare este absent dacă stimulul-amorsă este prezentat doar de ms înainte de apariţia stimulului-ţintă În acest context nu spunem despre efectul de amorsare că nu funcţionează, ci că efectul nu apare dacă expunerea la stimulul-amorsă este mai mică de de ms Un exemplu similar, dar mai facil de înţeles vine din sfera medicinei Putem spune despre un anumit antibiotic că este eficient în combaterea unei maladii doar dacă discutăm la un nivel generic În realitate, antibioticul respectiv este eficient în lupta cu maladia respectivă doar dacă este luat în anumite doze prestabilite experimental Probleme cu livrarea integră a intervenţiei/acurateţea manipulării VI Între ceea ce este planificat pe hârtie şi ceea ce se întâmplă în realitate pot exista uneori diferenţe importante ca urmare a devierii de la protocolul (manualul) intervenţiei, de la procedura standard stabilită Conform lui Carroll et al ( ), orice intervenţie oferită ar trebui descrisă în termeni de: (a) doză oferită – frecvenţa, numărul şi durata şedinţelor; (b) ingrediente active ale intervenţiei – specificul intervenţiei şi premiza generală urmărită pentru a produce modificările dorite; (c) condiţii în care sunt administrate; (d) evaluarea măsurii în care intervenţia a fost livrată adecvat De exemplu, în cazul ipotetic al unui studiu ce ar viza efectul terapiei raţional-emotive în direcţia reducerii depresiei comparativ cu un grup de control de tipul listei de aşteptare, o posibilă descriere a intervenţiei oferită grupului experimental ar putea fi: Terapia raţional-emotivă implementată în grupul experimental: (a) s-a derulat bisăptămânal, timp de de şedinţe cu durata de oră; (b) în cadrul acestora s-au urmărit identificarea, disputarea şi înlocuirea credinţelor iraţionale ale participanţilor cu altele raţionale, îndeosebi a celor care conţin referiri autodepreciative (self-downing irrational beliefs), considerate a fi responsabile pentru apariţia/menţinerea depresiei; (c) şedinţele s-au derulat individual, prin intermediul a patru terapeuţi certificaţi REBT, cu o experienţă clinică medie de ani de zile; (d) intervenţiile s-au derulat conform specificaţiilor prezentate în manualul intervenţiei, aderenţa la tratament fiind verificată prin sondaj cu ajutorul înregistrărilor audio existente Cu alte cuvinte putem spune despre o intervenţie că are probleme cu livrarea integră (implementarea fidelă) dacă: (a) nu dispune de un manual de intervenţie care să ofere recomandări standard cu privire la ceea ce este de făcut în cadrul intervenţiei; (b) dispune de un asemenea manual, dar din verificările efectuate se constată o aderenţă scăzută a terapeuţilor/trainerilor la specificaţiile din manual (fie din cauza unui nivel precar de pregătire al celor care implementează intervenţia, fie din cauze motivaţionale diverse, fie de la un stil de lucru orientat mai degrabă spre nevoile clientului decât spre atingerea obiectivelor planificate) În sfârşit, o a treia cauză posibilă pentru apariţia unei discrepanţe între ceea ce se intenţionează a se livra şi ceea ce se întâmplă în realitate poate fi (c) un nivel scăzut al complianţei clienţilor la cerinţele formulate de către terapeuţi/traineri Din motivele invocate mai sus, se obişnuieşte ca, în studiile randomizate controlate care urmăresc eficienţa unei intervenţii, să fie colectate date suplimentare cu privire la integritatea intervenţiei livrate, aşa cum a fost ea planificată iniţial, cu referire specifică la punctele (b) şi (c) menţionate în paragraful anterior Astfel, se vorbeşte de aderenţa terapeuţilor la tratament dacă, în urma examinării unui eşantion de şedinţe din totalul şedinţelor de terapie înregistrate, se constată o corespondenţă între ceea ce era specificat în manualul intervenţiei cu privire la şedinţa respectivă şi ceea ce s-a întâmplat de fapt Corespondenţa nu vizează aspecte de detaliu (replici etc ), ci vizează obiectivul şedinţei şi repertoriul de exerciţii/sarcini de efectuat în vederea atingerii obiectivului respectiv Tot prin intermediul unor aprecieri, mai degrabă cu caracter subiectiv, obţinute prin intermediul unui expert neimplicat în studiu, se poate evalua competenţa celor care livrează intervenţia În sfârşit, se poate de asemenea evalua nivelul de complianţă al participanţilor la intervenţia primită (măsura în care acceptă serviciile primite şi răspund pozitiv solicitărilor formulate de terapeuţi – de exemplu, prin efectuarea temelor pentru acasă) Aspecte legate de integritatea livrării (manipulării) variabilei independente apar şi în alte contexte experimentale decât cele care vizează testarea eficienţei unei intervenţii În acest context al discuţiei pot fi evidenţiate două nuanţe ale integrităţii cu referirea la adecvarea manipulării experimentale Pe de o parte, transpare ideea implementării standardizate a manipulării VI (absenţa unor artefacte introduse de erori experimentale) Un astfel de exemplu este cel determinat de respectarea protocolului standardizat în activarea condiţiilor experimentale şi a altor aspecte procedurale implicate (de exemplu, dacă studiul solicită ca subiectul să fie poziţionat la cm de un monitor cu diagonală de inch, atunci ar trebui să se respecte această cerinţă; dacă studiul presupune un anumit instructaj standard, atunci acesta ar trebui livrat integral şi celor care dau impresia că au înţeles repede sarcina pe care o au de efectuat etc ) Pe de altă parte, integritatea tratamentului în contexte experimentale, cum sunt cele de laborator, face referire directă la conceptul cunoscut sub denumirea de verificarea reuşitei manipulării experimentale (manipulation check) – vezi caseta pentru ilustrarea conceptului şi importanţa acestuia pentru validitatea de construct a studiului Caseta Verificarea reuşitei manipulării experimentale Exemplu ipotetic Dispoziţia afectivă negativă scade performanţa la probe de viteză mentală Pentru a verifica validitatea acestei afirmaţii, s-a apelat la un experiment în care participanţii au fost împărţiţi în trei condiţii experimentale Astfel, în prima fază a experimentului unii au citit o istorioară amuzantă cu un final fericit pentru personajul principal al poveştii, alţii au citit o istorioară tristă cu un final negativ de poveste, iar un al treilea grup a citit un text abstract, neutru din perspectiva mesajului şi a deznodământului oferit Această manipulare experimentală a fost implementată pornind de la premisa că celor din prima condiţie experimentală povestirea amuzantă le va induce o stare de spirit optimistă, pozitivă, celor din a doua condiţie experimentală povestirea tristă le va induce o dispoziţie afectivă negativă, iar cei din cea de-a treia condiţie experimentală vor avea o dispoziţie afectivă neutră În a doua fază a experimentului, toţi participanţii la studiu, indiferent de condiţia lor experimentală au completat un test de viteză perceptivă, luându-se în calcul performanţa lor ca număr de elemente parcurse corect într-un interval de minute Rezultatele statistice au arătat că există diferenţe între cele trei grupe, cei din condiţia experimentală (povestire cu final trist) având cel mai scăzut nivel al performanţei la sarcina de viteză Pentru a ne putea asigura că inferenţa de la baza acestui studiu este una corectă (că manipularea experimentală este adecvată) este necesar să arătăm mai întâi că există diferenţe între cele trei grupe comparate cu privire la nivelul dispoziţiei lor afective, nu doar să presupunem acest lucru De exemplu, subiecţii ar putea răspunde după finalizarea istorioarei la un set scurt de itemi care să reflecte starea lor de moment (cât de bine sau cât de trişti se simt în momentul respectiv?), iar apoi să completeze proba de viteză Vom considera că manipularea experimentală a reuşit dacă între cele trei grupe se constată diferenţe semnificative cu privire la dispoziţia lor afectivă din momentul respectiv, în direcţia anticipată încă din momentul planificării studiului (de exemplu, că dispoziţia afectivă negativă are cel mai înalt nivel în condiţia experimentală în care s-a lecturat povestea cu un final trist, diferenţa faţă de celelalte două grupe fiind una semnificativă statistic) Deşi poate părea redundant, un asemenea demers constituie o măsură necesară pentru a ne asigura că ceea ce s-a intenţionat (obţinerea unor variaţii în dispoziţia afectivă a participanţilor în funcţie de condiţia lor experimentală) s-a petrecut în realitate Pot exista situaţii când manipularea experimentală eşuează, din diverse motive precum: (a) variaţii prea mici în intensitatea stimulilor (de exemplu, deşi alcoolul scade timpul mediu de reacţie, se poate ca acest lucru să nu fie observat dacă se compară două loturi care consumă cantităţi reduse de alcool ( ml de bere vs ml de bere); (b) caracterul artificial (nivelul redus de realism al condiţiei experimentale), fapt ce îi poate determina pe participanţi să răspundă diferit de comportamentul lor natural În sfârşit, verificarea manipulării experimentale poate juca un rol important în eliminarea unor explicaţii alternative De exemplu, în cazul descris mai sus o altă explicaţie posibilă pentru scăderea vitezei de percepţie are legătură mai degrabă cu alterarea percepţiei timpului (perioada de timp petrecută pentru lecturarea povestirii triste pare a fi mai lungă), iar acest efect poate fi reportat în proba de viteză, participanţii având impresia că au mai mult timp la dispoziţie pentru completarea ei, fapt pentru care adoptă un ritm ceva mai puţin alert de lucru Pentru a elimina o asemenea explicaţie alternativă, la finalul povestirii participanţii pot fi rugaţi atât să estimeze timpul care a trecut de la momentul începerii lecturării povestirii, cât şi să se autoevalueze cu privire la dispoziţia lor afectivă curentă Dacă nu se constată diferenţe semnificative între grupe cu privire la durata timpului estimat, dar apar diferenţe între grupe în direcţia aşteptată cu privire la starea lor afectivă, putem spune că explicaţia bazată pe diferenţe în dispoziţia afectivă este validă Din acest punct de vedere, verificarea reuşitei manipulării experimentale poate oferi explicaţii utile, verificabile ulterior prin studii ce vizează identificarea mecanismelor schimbării responsabile pentru apariţia unei relaţii de tip cauză-efect În urma introducerii verificării reuşitei manipulării experimentale şi a măsurării existenţei unei relaţii dintre VI şi VD rezultă patru situaţii posibile (Kazdin, ): (a) efectele apar atât la nivelul manipulării experimentale, cât şi la nivelul variabilei dependente; (b) manipularea experimentală pare a fi reuşit (există diferenţe între grupe), dar nu există diferenţe la nivelul VD; (c) manipularea experimentală pare a nu fi reuşit (nu există diferenţe între grupe), dar acestea apar la nivelul VD; (d) nici cu ocazia verificării reuşitei manipulării experimentale, nici la nivelul diferenţelor dintre grupe cu privire la VD, nu se obţin rezultate semnificative statistic Interpretarea semnificaţiilor posibile pentru aceste rezultate este reflectată în tabelul de mai jos Tabelul Interpretarea rezultatelor ca urmare a dinamicii dintre efectul la nivelul VD şi reuşita (nereuşita) manipulării experimentale Cazul A Manipularea VI reuşită (p , ) (i) VI nu are efect asupra VD (nu există o relaţie cauzală) sau (ii) deşi manipularea VI a reuşit, sunt probleme de măsurare a VD care necesită o amplificare a manipulării VI Exemplu (ii): manipularea VI a reuşit să modifice cogniţii/atitudini, dar nu schimbă comportamente (VD reflectând în acest caz comportamente) Pentru ca efectele să apară şi la nivel comportamental, ar fi necesar să se intensifice manipularea VI (de exemplu, în locul unui program de dezvoltare personală cu durata de de ore să se aplice unul de de ore)  Cazul C Manipularea VI nereuşită (p > , ), efect VD prezent (p , ), efect VD absent (p > , ) Nu este clar dacă VI are efect asupra VD Manipularea a fost prea slabă pentru a produce efecte, prin urmare ipoteza studiului nu a fost realmente testată Sunt necesare modificări în modul de manipulare a VI   Reactivitatea participanţilor la studiu Participanţii la studiile psihologice, cu atât mai mult la cele derulate în condiţii de laborator, au tendinţa de a reacţiona diferit de felul lor natural de a fi, atunci când ştiu că sunt supuşi unei evaluări psihologice (vezi caseta ) Acest lucru constituie un risc privitor la validitatea de construct deoarece ar fi dificil de precizat dacă explicaţia pentru efectul obţinut se regăseşte în caracteristicile intervenţiei sau este doar o consecinţă a reactivităţii participanţilor Caseta Ilustrarea reactivităţii participanţilor ca risc privitor la validitatea de construct Reactivitatea participanţilor Exemplificare: Într-un studiu cvasiexperimental se urmăreşte dacă un material persuasiv despre un personaj politic modifică atitudinea potenţialilor alegători faţă de acesta Astfel, atât înainte, cât şi după prezentarea unui film documentar de de minute, participanţii sunt rugaţi să evalueze gradul de simpatie pe care îl au faţă de personajul respectiv, pe o scală de la [extrem de antipatic] la [extrem de simpatic] Conţinutul filmului documentar era unul negativ la adresa acestuia Rezultatul obţinut sprijină ideea eficienţei unor astfel de materiale, nivelul de simpatie pentru personajul evaluat fiind mai redus la posttest decât la pretest Prin reactivitatea participanţilor se înţelege, la nivel general, ideea că participanţii dintr-o cercetare sunt conştienţi de acest rol, fapt pentru care se pot comporta diferit faţă de felul lor natural sau pot decide să ofere răspunsuri consistente cu ipotezele implicite pe care cred că le testează studiul De exemplu, în cazul descris, este foarte probabil ca mulţi dintre participanţi să intuiască ce se urmăreşte prin studiul respectiv, cum ar fi „în ce măsură pot fi ei influenţaţi de materiale cu rol propagandistic?” În baza acestei intuiţii cu privire la scopul studiului, ei pot decide să ofere răspunsuri care să-l mulţumească pe experimentator, în direcţia reducerii nivelului de simpatie pentru personaj Alţii pot adopta poziţii opuse, de rezistenţă faţă de materialul persuasiv Această situaţie este cunoscută în literatura de specialitate sub denumirea de caracteristicile sarcinii (demand characteristics) (Orne, apud Kazdin, ) Cel mai adesea, consecinţa acestui efect este de a sprijini ipoteza intuită, fiind mai mulţi participanţi complianţi (sau preocupaţi să lase o impresie bună), decât participanţi rezistenţi (care „nu se lasă păcăliţi/manipulaţi” de către experimentator) Soluţii uzuale: Chestionarea participanţilor la finalul experimentului (debriefing) cu privire la ce cred că s-a urmărit prin studiu (care erau ipotezele vizate) şi analiza statistică a rezultatelor separat la cei care au intuit, respectiv nu au intuit corect despre ce a fost vorba în studiu Reactivitatea este prezentă dacă eficienţa intervenţiei (manipulării experimentale) apare numai la cei care au intuit ce se urmărea prin studiul respectiv/este mai intensă în cazul acestora Noutatea intervenţiei Acest tip de risc reprezintă un tip particular de reactivitate a participanţilor Orice intervenţie nouă, o inovaţie într-un domeniu, poate contribui la creşterea entuziasmului, a energiei şi aşteptărilor cu privire la utilitatea unei asemenea intervenţii (pe principiul că dacă este un produs sau serviciu de ultimă oră ar fi mai bun decât altele existente pe piaţă de ceva timp) În cazul unor rezultate semnificative statistic este greu de stabilit dacă acest fapt se datorează eficienţei intervenţiei în sine sau este o consecinţă a percepţiei pozitive (a etichetelor de tip „nou”, „revoluţionar”, „de ultimă generaţie”) Un tip aparte de efect, ca rezultat al combinaţiei dintre noutate şi reactivitatea participanţilor este efectul Hawthorne (Roethlisberger şi Dickson, apud Shadish et al , ) Acesta se referă la situaţiile în care apar modificări semnificative între momentul dinainte şi cel de după introducerea unei intervenţii, dar acest lucru nu este generat de eficienţa intervenţiei, ci de situaţia experimentală în sine (participanţii sunt conştienţi de statutul lor social special ca subiecţi în cercetare, se bucură de o atenţie specială şi sunt beneficiarii unor intervenţii „noi”, diferite de activităţile de uzură în care au fost implicaţi până atunci) Pentru a diferenţia dacă efectul observat este datorat intervenţiei în sine sau elementului de noutate, se poate urmări dacă intervenţia îşi păstrează aceeaşi magnitudine a mărimii efectului (un nivel similar de eficienţă), pe măsura trecerii timpului Contaminarea Prin contaminare se are în vedere situaţia când o parte sau întreaga intervenţie destinată grupului experimental devine cunoscută şi grupului de control De exemplu, un program de consiliere menit să îmbunătăţească comunicarea asertivă este implementat într-o clasă de elevi (a IX-a A), în timp ce elevii din clasa a IX-a B sunt incluşi în studiu drept grup de control În pretest, cele două clase au înregistrat niveluri similare în abilitatea de a comunica asertiv Totuşi, după fiecare şedinţă de consiliere, câţiva elevi din clasa a IX-a A se întâlnesc cu prietenii lor din clasa a IX-a B, cărora le povestesc din secretele deprinse în orele de consiliere Aceştia devin interesaţi de acest subiect şi decid să exerseze şi ei sarcinile primite ca temă pentru acasă de către cei din grupul experimental Ca urmare a acestui fapt, se obţine un rezultat nesemnificativ statistic, astfel că eficienţa programului de consiliere nu este sprijinită de datele empirice colectate Contaminarea, deşi este inclusă clasic în rândul riscurilor privitoare la validitatea de construct, poate fi percepută ca un pericol pentru validitatea internă, deoarece creşte probabilitatea apariţiei unei erori de tip II (să nu fie identificate diferenţe semnificative statistic, când ar fi trebuit să apară, dar acestea au fost estompate prin faptul că şi cei din grupul de control au beneficiat parţial sau în întregime de facilităţile oferite celor din grupul experimental) Astfel, în funcţie de gravitate (nivelul de extindere al contaminării), consecinţa poate consta în diminuarea intensităţii efectului produs de intervenţie (diminuarea mărimii efectului) sau chiar în anularea efectului produs de intervenţie (diferenţe nesemnificative între cele două grupe) O soluţie posibilă în contextele cu risc crescut de apariţie a contaminării (de exemplu, în cazul în care grupele comparate sunt constituite din două clase şcolare paralele din cadrul aceleiaşi şcoli) este aceea de a apela la studii experimentale cu randomizare la nivel de cluster Efectul tratamentului diferenţiat Acest efect se manifestă la participanţii din grupul de control atunci când: (a) aceştia fac parte dintr-un grup de control pasiv de tipul absenţei intervenţiei sau a listei de aşteptare (detalii în secţiunea ); (b) în cazul în care deşi beneficiază de o intervenţie activă, ca membri ai grupului de control, ei ştiu că serviciul pe care-l primesc nu este cel inovativ, experimental (potenţial mai bun decât celelalte forme de intervenţie existente la vremea respectivă) Într-un astfel de caz este foarte posibil ca rezultatele grupului de control, în consecinţă întregul demers comparativ, să fie afectate: (a) fie prin demoralizarea membrilor din grupul de control pentru faptul că nu beneficiază de facilităţile oferite celor din grupul experimental; (b) fie prin comportamente de compensare (pentru a nu rămâne în urmă faţă de cei din grupul experimental) În plus, în cazul grupelor de control pasiv cercetătorii pot interveni oferindu-le beneficii compensatorii pentru neincluderea în condiţia experimentală activă, pentru a-i motiva să rămână participanţi în studiu Această atenţie sporită şi eventualele beneficii compensatorii oferite, s-ar putea să producă un efect activ nespecific, cauzat de simpla atenţie/grijă acordată participanţilor din grupul de control Consecinţele tratamentului diferenţial variază în funcţie de predominanţa efectului observat Astfel, dacă în grupul de control apare mai frecvent demoralizarea membrilor, se măreşte diferenţa dintre condiţiile experimentale (nu mai ştim cu certitudine dacă diferenţele observate sunt cauzate de intervenţie, ca urmare a nivelului motivaţional scăzut din grupul de control sau a diferenţelor cu privire la expectanţa succesului între condiţiile experimentale) În schimb, dacă membrii din grupul de control adoptă mai degrabă comportamente compensatorii sau dacă sunt beneficiarii unui surplus de atenţie şi/sau măsuri compensatorii, este posibil ca distanţa dintre grupele experimentale să se reducă Astfel că, în situaţia unui rezultat nesemnificativ statistic, nu vom cunoaşte dacă rezultatul este cauzat de ineficienţa intervenţiei sau de tratamentul diferenţiat cu rol compensator pe care îl adoptă sau de care se bucură participanţii incluşi în grupul de control Cea mai eficientă şi întâlnită soluţie pentru acest tip de risc este oferirea unor intervenţii nespecifice de tip placebo participanţilor din grupul de control sau mascarea rezultatului distribuirii randomizate (designuri de tip orb) acolo unde acest lucru este posibil Aşteptările experimentatorului Cele mai cunoscute efecte din această categorie sunt efectele de autoîndeplinire a profeţiei, respectiv Pygmalion, care apar drept consecinţe ale unor aşteptări diferenţiate (Rosenthal, apud Kazdin, ) În zona oricărei forme de intervenţie, ele se pot observa sub forma unor schimbări în tonul vocii, în postură, în expresia facială, în tipul de întrebări formulate sau în modul de adresabilitate faţă de client Dacă acesta face parte din condiţia experimentală activă (comparativ cu un grup de control pasiv) sau din condiţia experimentală preferată de către experimentator sau despre care acesta are impresia că este mai eficientă decât alte forme de intervenţie (în comparaţii cu un grup de control activ, perceput mai puţin pozitiv), este posibil ca diferenţele observate la finalul intervenţiei să nu fie cauzate de diferenţe în eficienţa acestora, ci de diferenţe în nivelul de aşteptare, în modul de implicare, în modul de relaţionare cu clienţii aparţinând grupelor diferite Desigur, acest tip de efect poate constitui un risc doar în contextul în care diferenţa observată apare în favoarea grupului preferat Între procedurile care pot fi implementate pentru a reduce riscul apariţiei acestui tip de ameninţare se regăsesc (Shadish et al , ): (a) utilizarea mascării condiţiei din care fac parte indivizii evaluaţi şi/sau a ipotezelor urmărite în studiu (de exemplu, prin implementarea unor designuri de tip orb pentru evaluatori şi/sau cei care implementează intervenţia); (b) reducerea la minimum a contactului dintre examinator şi participanţii la studiu Alte măsuri care pot fi luate sunt: (c) utilizarea unui număr mai mare de asistenţi de cercetare care implementează studiul, pentru a putea identifica un eventual caz în care efectul obţinut este moderat de stilul (aşteptările) asistenţilor de cercetare/terapeuţilor/trainerilor care au implementat studiul; (d) replicarea studiilor experimentale în contexte variate din perspectiva aşteptărilor cercetătorilor (de exemplu, studiul se replică nu numai de către echipa de cercetători care propun intervenţia respectivă ca o noutate, ci şi de către o echipă concurentă, care poate testa eficienţa intervenţiei respective fără a fi acuzată de conflicte de interese sau de un nivel diferit de aşteptări şi implicare în intervenţiile supuse testării) Validitate de construct la nivelul efectelor (variabilelor) măsurate În psihologie, cel mai adesea se apelează la constructe abstracte (de exemplu, inteligenţa emoţională) care trebuie operaţionalizate (măsurate) în vederea colectării unor date empirice şi obţinerii unor rezultate Pe baza rezultatelor obţinute sunt discutate, mai apoi, implicaţiile acestora din nou la un nivel abstract (conceptual, teoretic) De aceea, în linii mari şi indiferent de forma de risc prezentată, atunci când vorbim despre validitatea de construct la nivelul variabilelor măsurate, inclusiv a celor de tipul VD, avem în vedere două întrebări fundamentale: (a) „sunt instrumentul sau procedura utilizate potrivite pentru a descrie constructul?”; (b) „sunt justificabile inferenţele explicative pe care le face cercetătorul de la rezultatele obţinute înapoi la teorie?” Prima întrebare se referă explicit la procesul prin care se trece de la constructul teoretic, prin operaţionalizare, la variabila măsurată (indicatorul utilizat) – de la construct la variabilă, de la general la particular Cea de-a doua întrebare se referă la demersul invers, acela de a reuşi să transforme rezultatele (variabilele analizate) în conţinuturi cu sens, relevante teoretic şi conceptual – de la variabilă la construct, de la particular spre general În secţiunea anterioară, dedicată prezentării riscurilor în legătură cu VI au fost abordate ambele aspecte, cu un accent pe cea de-a doua întrebare, deoarece prin natura lor, studiile experimentale (îndeosebi cele cu un scop cauzal-explicativ) sunt centrate pe oferirea de explicaţii referitoare la mecanismul cauzal implicat Ambele întrebări sunt importante şi pentru validitatea de construct cu referire la alte variabile decât cele care implică manipulare experimentală (VI) De aceea, o bună parte dintre riscurile discutate în secţiunea precedentă sunt valabile şi pentru variabile-efect (VD) sau pentru variabile provenite din studii non-experimentale Tabelul conţine o descriere a celor mai relevante riscuri privitoare la aceste variabile Tabelul Riscuri privitoare la validitatea de construct cu referire la variabilele-efect Riscuri privitoare la validitatea de construct a altor variabile decât VI (provenite din studii non-experimentale; VD)  Complexitatea constructului (construct confounding) Exemplificare: Într-un studiu comparativ non-experimental se constată diferenţe între partidele parlamentare şi cele neparlamentare privitoare la probabilitatea de a intra în parlament în mandatul următor, în favoarea celor parlamentare Asumând că inferenţa este corectă din punctul de vedere al validităţii statistice, pot apărea probleme cu interpretarea (explicarea) rezultatului De exemplu, cercetătorul ar putea să afirme că partidul parlamentar are mai mari şanse să intre din nou în parlament pentru că pe durata mandatului în care este partid parlamentar are un acces mai mare la resurse, ceea ce poate însemna atragerea unor oameni mai valoroşi/capabili să câştige noi curse electorale Însă o asemenea inferenţă ar fi problematică din perspectiva validităţii de construct, pentru că partidele parlamentare se deosebesc de cele neparlamentare şi cu privire la alte aspecte cum ar fi: (a) un nivel de mediatizare diferit (timpul de antenă mai ridicat pentru partidele parlamentare, inclusiv în campaniile electorale); (b) o mai bună reţea teritorială (structură organizatorică) pentru partidele cu reprezentanţi în parlament; (c) absenţa impresiei de vot irosit în cazul partidelor parlamentare (de exemplu, în cazul partidelor neparlamentare, deşi unii candidaţi pot fi percepuţi pozitiv, ei nu ajung să fie votaţi pentru că alegătorii nu ar dori să-şi irosească votul respectiv, în condiţiile în care le lipseşte încrederea că partidul respectiv va atinge pragul electoral solicitat)  Subreprezentarea constructului (mono-operation bias) Exemplificare: Într-un studiu corelaţional ar fi discutabil să se afirme că există o asociere semnificativă statistic între nivelul de conştiinciozitate şi angajamentul organizaţional din perspectiva validităţii de construct, dacă relaţia se replică doar în cazul în care trăsătura de personalitate vizată este măsurată prin proba X, nefiind susţinută dacă conştiinciozitatea este evaluată prin probele Y sau Z O problemă similară apare atunci când nivelul de conştiinciozitate corelează cu performanţa în muncă doar în contextul în care criteriul este evaluat prin hetero-raportare, dar nu şi atunci când criteriul este măsurat într-un alt fel (de exemplu, apelând la un indicator obiectiv – criteriu hard) În sfârşit, dacă ar fi să ne raportăm la un exemplu menţionat ceva mai devreme, transferat într-un design non-experimental, privind compararea nivelului de agresivitate la cei care ascultă muzică hip hop versus şlagăre, ar creşte validitatea de construct dacă se apelează la un număr variat de artişti şi de piese muzicale din interiorul genului muzical evaluat decât dacă ne-am baza doar pe câte - piese pentru fiecare din cele două genuri de muzică  Confuzia dintre construct şi modalităţile sale (confounding constructs with levels of constructs) Exemplificare: În cazul în care se constată că nivelul conştiinciozităţii ca dimensiune globală de personalitate corelează semnificativ cu performanţa în muncă, se pot efectua analize ulterioare, la nivel de faţete, pentru a revela care dintre faţetele conştiinciozităţii corelează cu performanţa în muncă (de exemplu, orientarea spre realizare) şi care rămân nesemnificative statistic (de exemplu, prudenţa) Astfel, în cazul studiilor non-experimentale discuţia cu privire la confuzia dintre construct şi modalităţile sale vizează nevoia unei nuanţări în interpretarea/explicarea rezultatelor  Distorsiunea metodei comune (mono-method bias) Exemplificare: Într-un studiu care urmăreşte să identifice potenţialul rol moderator al afectivităţii negative în relaţia dintre conştiinciozitate şi comportamentele contraproductive ale angajaţilor, toate cele trei variabile amintite, importante pentru scopul studiului, sunt măsurate prin aceeaşi metodă – completarea unor probe standardizate ce necesită autoraportare (self-reports) Dacă toate variabilele sunt măsurate prin acelaşi tip de metodă (de exemplu, prin autoraportare), metoda devine parte din constructele măsurate, crescând artificial intensitatea asocierii dintre variabile Aspectele comune pot viza oricare dintre caracteristicile instrumentelor utilizate (probele necesită acelaşi tip de răspuns, pe scală Likert în trepte; probele apelează la autoraportare; probele împărtăşesc acelaşi stil de construcţie a frazei, itemii fiind formulaţi în termeni pozitivi; probele sunt similare din perspectiva nivelului de dezirabilitate socială implicat etc ) Problema apare ca urmare a faptului că nu se poate distinge bine dacă eventuala asociere dintre două variabile este determinată de existenţa unei legături reale între variabile sau este doar un artefact al faptului că ambele variabile împărtăşesc aceeaşi metodă (acelaşi fel de colectare a datelor)  Această problemă este foarte cunoscută în literatura de specialitate din domeniul psihologiei organizaţionale, dar mai puţin cunoscută în domeniul psihologiei clinice, fiind întâlnită sub denumirea de varianţa metodei comune (shared method variance sau common method bias) (P M Podsakoff, MacKenzie, Lee şi N P Podsakoff, ) De altfel, într-un studiu ulterior, acelaşi grup de autori semnalau nivelul pandemic al acestui risc ( % dintre studii implică o singură metodă de colectare a datelor, iar % dintre studii se bazează exclusiv pe completarea de chestionare autoraportate) (Bodner, apud P M Podsakoff, MacKenzie şi N P Podsakoff, ) Impactul acestei distorsiuni este semnificativ la nivel de rezultate De exemplu, o metaanaliză a relaţiei dintre factorii de personalitate şi performanţa în muncă, ambele măsurate prin autoraportare evidenţiază un efect mediu r = , , în timp ce aceeaşi relaţie evaluată în contextul utilizării unor metode diferite de colectare a datelor (personalitatea prin autoraportare, performanţa în muncă prin heteroraportare sau prin indicatori obiectivi) conduce la un efect r = , (Podsakoff et al , )  Dovezi insuficiente sau neconcludente cu privire la validitatea instrumentului utilizat Exemplificare: Majoritatea aspectelor legate de neajunsuri în calitatea psihometrică a unor instrumente (probleme de consistenţă internă, restricţia de amplitudine etc ) au fost discutate în secţiunea referitoare la validitatea statistică Însă pot fi întâlnite cazuri în care nu se constată probleme cu privire la acurateţea şi variabilitatea datelor colectate, ci cu privire la semnificaţia acestora sau etichetarea lor În România, unul dintre exemplele tipice care îmi vin în minte este cazul probei de mobilitate a atenţiei Praga, extrem de întâlnită în laboratoarele şi cabinetele de psihologia transporturilor Acest test, deşi are o consistenţă internă şi o validitate relativă la criteriu bună, măsoară altceva decât cred cei mai mulţi că măsoară Astfel, foarte mulţi practicieni cunosc proba ca un instrument de măsurare a atenţiei distributive, confuzie la a cărei origini se află Bontilă ( ) Acesta a etichetat-o ca o probă de atenţie distributivă, fără a oferi sprijin ştiinţific pentru aceasta La perpetuarea acestei erori a contribuit din plin mediul academic românesc, care a inclus proba în cursurile adresate studenţilor, fără o analiză critică, în categoria testelor de atenţie distributivă Însă, dacă vom analiza atent conţinutul probei, vom putea identifica imediat faptul că nu există elementele necesare unei sarcini de atenţie distributivă Aceasta presupune prin definiţie rezolvarea simultană a două sarcini diferite (de exemplu, a număra cu voce tare în sens descrescător, de la la , în timp ce se scrie un text nou după dictare) Situaţii similare pot apărea la case mai mari De exemplu, în domeniul expansiv al cogniţiilor sociale implicite (Gawronski şi Payne, ; Sava, ) se vorbeşte despre măsurători implicite ale stimei de sine Cu toate că există dovezi empirice în sprijinul unei asemenea etichetări, nu există suficiente date pentru a ne asigura că ceea ce se surprinde prin sarcinile respective este stima de sine implicită şi nu concepte apropiate sau similare precum încrederea de sine (self-confidence), autoeficacitatea (self-efficacy) sau aprecierea de sine (self-worth) Pentru a evita situaţii ce decurg din definirea sau operaţionalizarea inadecvată a unui construct, Trochim ( ) recomandă parcurgerea a trei paşi: (a) definirea constructului prin raportarea la o reţea semantică existentă de constructe (prin ce se aseamănă şi prin ce diferă de alte constructe apropiate ca sens); (b) să operaţionalizeze constructul ţinând cont de aspectele acestuia definitorii (de exemplu, într-o probă de atenţie distributivă trebuie să se solicite rezolvarea în acelaşi timp a două sarcini diferite, nu doar să se chestioneze individul dacă reuşeşte să facă faţă la mai multe sarcini derulate simultan – care ar fi doar o percepţie autoraportată a nivelului atenţiei distributive, în cel mai bun caz, sau un item specific evaluării nivelului de autoeficacitate, în cazul mai puţin fericit); (c) să existe dovezi empirice care să confirme relaţia dintre constructul evaluat şi alte constructe sau acelaşi construct măsurat prin probe deja consacrate De obicei, acest punct c lipseşte (sau este mai puţin dezvoltat) în cazul unor probe nou-apărute De aceea, ar fi indicat ca cercetătorul fie să apeleze la instrumente deja consacrate pentru evaluarea unui anumit construct, fie să apeleze la instrumente mai puţin cunoscute pentru care să se ofere informaţii suplimentare despre validitatea şi fidelitatea probei, pentru a înlătura reticenţele evaluatorilor cu privire la calităţile psihometrice ale instrumentului respectiv   Validitatea externă Brewer ( ) subliniază ideea că validitatea externă are în vedere ideea replicării rezultatelor, a generalizării rezultatelor obţinute într-un studiu, pe alte persoane, contexte sau alte proceduri de cercetare (alte modalităţi de manipulare ale VI, alte VD, alte tipuri de design) Din acest punct de vedere, problematica validităţii externe vizează măsura în care rezultatele pot fi replicate în contexte diferite („avem de-a face cu rezultate robuste?”, „ce factori moderatori au fost identificaţi?”) şi cu gradul de realism (transfer) al acestor rezultate în contexte naturale („pot fi efectele transferate în contexte aplicative etc ?”) Replicarea rezultatelor (robusteţea rezultatelor) Spre exemplu, problema validităţii externe într-un studiu al cărui rezultat principal identifică o relaţie semnificativă statistic între expunerea la filme cu conţinut violent şi nivelul de agresivitate vizează validitatea inferenţelor cu privire la posibilitatea extinderii acestor rezultate: (a) la alte categorii de participanţi (rezultatele sunt replicate nu numai pe lotul de copii de gimnaziu examinaţi, ci şi pe alte categorii posibile: tineri, adulţi, atât în cazul băieţilor, cât şi al fetelor etc ); (b) în alte contexte decât cel din cercetare (nu doar în studii de laborator, ci şi în contexte naturale, cum ar fi vizionarea unui film violent într-un cinematograf dintr-un mall); (c) la alte modalităţi de operaţionalizare a variabilelor studiate (de exemplu, rezultatul este acelaşi dacă se apelează la un chestionar self-report de evaluare a agresivităţii de stare, cât şi dacă se utilizează o măsură indirectă de evaluare a agresivităţii, cum ar fi IAT-ul [testul asocierilor implicite; Greenwald McGhee şi Schwartz, ], sau o măsură obiectivă, directă a agresivităţii precum observarea frecvenţei în care este pedepsit un personaj din cadrul unui joc pe calculator ce solicită administrarea de pedepse unui personaj, dacă acesta nu atinge un anumit standard specificat etc ) În sfârşit, dacă studiul este unul experimental, se urmăreşte şi măsura în care rezultatul este replicat în condiţiile în care se variază modul de manipulare a VI (de exemplu, efectul apare în orice tip de material video catalogat drept unul violent, atât în cele care prezintă cazuri ficţionale [filme SF], cât şi în cele care prezintă situaţii reale [„Ştirile de la ora ”] etc ) Shadish et al ( ) limitează discuţia despre validitatea externă doar la cazul studiilor experimentale sau cvasiexperimentale, aceasta fiind definită ca măsura în care relaţia cauzală transpare în situaţia varierii persoanelor, contextelor, intervenţiei oferite şi a modalităţii de măsurare a efectelor (VD) Consider această restrângere a sferei de acţiune a discutării aspectelor de validitate externă doar în legătură cu inferenţe referitoare la relaţii de tip cauză-efect ca fiind una limitativă şi mai puţin inspirată Aşa cum am amintit anterior, studiile nu vizează numai obiective de tip cauzal-descriptiv sau cauzal-explicativ De exemplu, ele pot urmări obiective descriptive propriu-zise („care este incidenţa anuală a depresiei majore la adolescenţi?”) sau descriptiv-analitice („poate prezice conştiinciozitatea performanţa la locul de muncă?”) Deşi niciunul dintre aceste studii nu urmăreşte obiective cauzale, ar fi important să vedem în ce măsură rezultatele lor sunt replicate în alte contexte şi/sau generalizabile la o întreagă populaţie de interes Prin urmare este important să analizăm studiile prin prisma validităţii lor externe De exemplu, dacă ar fi să ne referim la faptul că a fost obţinută o asociere între conştiinciozitate şi performanţa în muncă, am avea mai mare încredere în şansele de replicare a acestui rezultat într-un context aplicativ, dacă studiul a fost efectuat într-un context natural, ecologic (cum ar fi în cadrul procesului de selecţie), decât dacă datele despre relaţia dintre conştiinciozitate şi performanţă în muncă au fost colectate în cadrul unui studiu de laborator (context artificial), în care performanţa a fost evaluată ca o măsură de stare, prin nivelul atins într-o sarcină de efectuat în cadrul studiului De aceea, pentru a analiza nivelul de reproductibilitate a rezultatelor obţinute într-un studiu, un rol important îl prezintă identificarea unor factori moderatori, cu alte cuvinte a efectelor de interacţiune dintre rezultatul obţinut şi diferiţi parametri ai studiului (variaţii cu privire la tipul de participanţi, ale contextului cercetării sau ale variabilelor implicate) Aceste interacţiuni, reprezintă de altfel, principalele riscuri privitoare la validitatea externă, aşa cum reiese din tabelul , cu precizarea că le vom redefini terminologic faţă de Shadish et al ( ), pentru a nu limita discuţia doar la cazul studiilor ce vizează scopuri cauzale Tabelul Riscuri privitoare la validitatea externă (adaptare după Shadish et al , ) Dependenţa efectului de populaţia studiată Este cunoscut faptul că cele mai multe studii din domeniul psihologiei sunt efectuate pe studenţi, datorită uşurinţei cu care aceştia pot fi selectaţi ca participanţi în studiu De exemplu, Sears ( apud Brewer, ) prezintă o statistică care indică că nu mai puţin de % dintre studiile de psihologie socială publicate în reviste de prestigiu în anul au fost efectuate pe studenţi din ciclul licenţă Riscul generat de această stare de fapt cu privire la validitatea externă este de a stabili în ce măsură efectele obţinute în cadrul unei populaţii specifice sunt replicate pe alte categorii de persoane Validitatea externă priveşte nu numai statutul acestora (sunt replicate efectele pe adulţi, copii, imigranţi, persoane aparţinând unor culturi diferite etc ), ci vizează şi impactul pe care îl are tipul de participanţi selectaţi (voluntari, recompensaţi financiar, preselectaţi etc ) Pentru a înlătura (reduce) asemenea riscuri, se recomandă fie apelul la eşantioane naţionale reprezentative, fie utilizarea unor eşantioane de convenienţă selective (purposive sampling), care să includă anumite categorii ţintite de participanţi Bunăoară, dacă se aşteaptă ca genul persoanei să modereze relaţia dintre variabilele studiate, ar fi bine ca lotul utilizat să includă participanţi de ambele sexe şi să se testeze rolul moderator al genului asupra relaţiei respective  Dependenţa efectului de contextul cercetării Un efect obţinut poate fi dependent de un anumit context în care se derulează cercetarea De exemplu, eficienţa pe termen lung a unui program de consiliere în vederea utilizării prezervativelor pentru a reduce riscul de transmitere a bolilor venerice sau al apariţiei sarcinilor nedorite apare doar în studiile implementate în mediul urban, dar nu şi la sate, pentru simplul motiv că prezervativele se găsesc mai uşor la oraş decât la sate Un alt exemplu ar fi asocierea dintre două variabile, precum observarea relaţiei dintre conştiinciozitate şi comportamentele contraproductive doar într-un context organizaţional în care liderul adoptă un stil de conducere laissez faire (pentru că un asemenea şef le oferă oportunităţi celor mai puţin conştiincioşi să devieze mai uşor) Pentru a controla impactul pe care contextul îl are asupra efectului studiat, se poate apela la studii cu un mare număr de participanţi derulate în locaţii multiple (large multisite studies) Dintre acestea, studiile randomizate controlate cu un număr mare de participanţi, derulate în locaţii multiple sunt destul de răspândite în domeniul sănătăţii mentale, unde sunt extrem de apreciate Ele sunt considerate de unii specialişti, precum Turok et al ( ), cel puţin la fel de importante precum metaanalizele de studii experimentale din perspectiva puterii dovezilor empirice obţinute prin asemenea demersuri, în timp ce alţi autori, precum Scifres, Iams, Klebanoff şi Macones ( ) sau LeLorier, Gregoire, Benhaddad, Lapierre şi Derderian ( ), le consideră a fi chiar mai relevante decât rezultatele din metaanalize Studiile randomizate multisite îmbină punctele forte ale unui design randomizat cu consecinţe pozitive asupra inferenţelor legate de validitatea internă a studiului, cu punctele forte ale unui studiu desfăşurat în locaţii multiple, utile pentru a infera aspecte legate de validitatea externă a concluziilor obţinute Detalii metodologice şi statistice introductive despre acest gen de studii pot fi găsite în Kraemer ( ) şi Raundenbush şi Liu ( )  Dependenţa efectului de variaţii ale intervenţiei oferite (de tipul de manipulare a VI) Efectul VI asupra VD poate fi dependent de anumite caracteristici ale VI De exemplu, este posibil ca impactul ascultării muzicii hip hop asupra agresivităţii adolescenţilor să apară numai în contextul în care se ascultă anumiţi MC (interpreţi) sau ca efectul coaching-ului executiv asupra performanţei în muncă să apară numai în cazul în care programul se derulează timp de de ore, în locul a ore, în şedinţe de grup, dar nu şi în cele de coaching individual În aceeaşi categorie a dependenţei efectului de specificul manipulării VI intră interacţiunea dintre VI în cazul unor designuri factoriale De exemplu, un medicament poate avea un anumit efect dacă este luat singur şi un alt efect dacă este luat în combinaţie cu alte substanţe cu care interferează  Pentru a analiza impactul situaţiei în care variaţii în modul de operaţionalizare ale VI afectează diferenţiat VD, se poate apela la: (a) analize de moderare în cadrul studiilor metaanalitice, pentru a observa impactul acestor caracteristici asupra intensităţii efectului observat la VD; (b) implementarea unor studii cu un design experimental mai complex (de exemplu, a unui design factorial) pentru a testa direct potenţialul efect moderator; (c) replicarea efectelor obţinute prin varierea caracteristicilor VI şi/sau a modului în care aceasta a fost manipulată (de exemplu, într-un studiu privind inducerea experimentală a unei bune dispoziţii prin tehnica amorsării (priming) se poate urmări dacă efectul apare utilizând stimuli-amorsă diferiţi: stimuli vizuali vs verbali, cu o durată de expunere de ms vs de ms etc )  Dependenţa efectului de modul de operaţionalizare al variabilelor, altele decât VI Atunci când se are în vedere studierea unei asocieri între două constructe sau chiar identificarea unei relaţii de tip cauză-efect între acestea, ar fi important să observăm că efectul se replică indiferent de modul în care a fost operaţionalizată variabila măsurată Însă de multe ori se constată că efectul este unul semnificativ statistic dacă se ia în considerare o anumită variabilă, dar devine unul nesemnificativ atunci când se are în vedere o altă variabilă De exemplu, într-un studiu privind eficienţa terapiei raţional-emotive comparativ cu tehnicile de relaxare Schultz în reducerea anxietăţii, pot fi găsite diferenţe semnificative statistic dacă se au în vedere scorurile la scala de anxietate Hamilton, dar nu apar diferenţe de eficienţă între cele două forme de psihoterapie dacă se iau în considerare rezultatele la scala de anxietate Zung, cu toate că ambele probe au fost aplicate pe acelaşi lot de subiecţi Riscul este valabil şi în cazul situaţiilor în care obţinem rezultate diferite pentru aceeaşi asociere studiată, în condiţiile în care s-a apelat la modalităţi diferite de operaţionalizare a variabilelor şi la participanţi diferiţi În legătură cu acest tip de risc, merită adus în discuţie exemplul oferit de Heppner, Wampold şi Kivlighan ( ), cu privire la dezbaterea dintre adepţii behaviorismului şi cei ai curentului psihodinamic vizavi de găsirea celor mai eficiente forme de intervenţie Dacă luăm în considerare modificările comportamentale (în simptomatologie), răspunsul ar fi că terapiile comportamentale ar fi mai eficiente Dacă avem în vedere starea de bine (cât de bine se simte pacientul?), situaţia ar putea chiar înclina în direcţia opusă Astfel, rezultatul este dependent de ceea ce se consideră a fi mai important, fapt pentru care s-a introdus distincţia dintre „a te face mai bine” (getting better) şi „a te simţi mai bine” (feeling better), diferenţă care are probabil rădăcini filosofice în distincţia dintre abordarea pozitivistă şi abordarea interpretativă O metodă utilă de analiză a dependenţei rezultatelor (efectelor) de modul în care au fost operaţionalizate variabilele din studiu este apelul la metaanaliză, un tip de studiu important prezentat pe larg în capitolul  Dependenţa efectului de mediere (mecanismului cauzal) de contextul studiului Spre deosebire de toate cele patru situaţii anterioare care se focalizau pe identificarea unor factori moderatori, acest risc vizează gradul de generalizare/de replicare a unui factor mediator, ca mecanism cauzal explicativ utilizat pentru relaţia dintre VI şi VD Riscul privitor la validitatea externă apare atunci când mecanismul cauzal identificat într-un studiu nu se replică într-altul sau se ajunge la identificarea unui mecanism cauzal alternativ Cu alte cuvinte, efectul obţinut este dependent de mecanisme cauzale diferite, în funcţie de variaţii în contextul (caracteristicile) cercetării Un astfel de exemplu ar putea fi cazul condiţionării afective Prin condiţionare afectivă (evaluative conditioning – EC) se înţelege măsura în care un stimul neutru (de exemplu, un cuvânt abstract şi fără sens precum „leinar”) primeşte în timp o conotaţie afectivă pozitivă (dacă este asociat repetat cu stimuli necondiţionaţi plăcuţi, cum ar fi fotografii cu bebeluşi râzând) sau o conotaţie afectivă negativă (dacă este asociat repetat cu stimuli necondiţionaţi negativi, cum ar fi persoane suferinde, fotografii cu copii maltrataţi etc ) Aplicaţiile acestui tip de condiţionare sunt numeroase: de la domeniul publicităţii (Sweldens et al , ) la domeniul clinic (Olantunji, Lohr, Sawchuk şi Westendorf, ) O explicaţie (mecanismul cauzal justificativ) oferită pentru acest efect este conştientizarea legăturii repetate dintre stimulul neutru şi cel necondiţionat (De Houwer, ) Conform acestui mecanism, valenţa afectivă a stimulului iniţial neutru se va modifica doar după ce participanţii vor realiza (vor conştientiza) legătura repetată dintre stimulul pozitiv şi cel neutru Alte studii însă contestă acest mecanism, propunând ca mecanism alternativ atribuirea greşită a valenţei afective de la stimulul necondiţionat spre cel neutru, acest lucru fiind realizat în mod inconştient (deoarece efectul a fost obţinut uneori în absenţa conştientizării legăturii dintre stimulul condiţionat şi cel necondiţionat) Prin urmare, ar fi interesant de urmărit în ce context se activează conştientizarea legăturii ca mecanism cauzal explicativ pentru apariţia efectului (pentru modificarea valenţei afective a stimulului condiţionat), respectiv în ce context se activează celălalt mecanism cauzal, atribuirea greşită a afectului Clarificări aduse în această direcţie de studii ar fi extrem de utile în zona cercetării aplicative, pentru a dezvolta metode eficiente de modificare a atitudinilor în funcţie de mecanismul cauzal activ în situaţia respectivă  Dependenţa rezultatelor de modalitatea de eşantionare utilizată în selectarea participanţilor la studiu Aş adăuga în categoria riscurilor privind robusteţea rezultatelor o problemă clasică întâlnită adesea în studii descriptive (non-experimentale), cum ar fi sondajele de opinie Selectarea participanţilor prin alte metode de eşantionare decât cele probabilistice (de exemplu, prin apelul la un eşantion de convenienţă), afectează atât validitatea statistică a studiului, cât şi pe cea externă, fiind improbabil să se obţină rezultate reprezentative pentru întreaga populaţie Cel mai întâlnit exemplu pentru a reflecta acest tip de risc este cel al sondajelor de opinie efectuate de diferite site-uri online sau de canale de televiziune De exemplu, răspunsurile la întrebarea „Aţi fi de acord cu reluarea demersurilor de suspendare a preşedintelui României, Traian Băsescu?” ar fi diferite dacă am chestiona telespectatorii canalului B TV sau dacă am chestiona telespectatorii Antenei , iar ambele ar fi distorsionate faţă de răspunsurile populaţiei generale, deoarece niciunul dintre sondajele respective nu apelează la metode probabilistice de selectare a eşantionului de participanţi chestionaţi Soluţia tipică pentru acest tip de problemă este selectarea participanţilor la studiu prin metode de eşantionare probabilistice (detalii suplimentare fiind oferite în capitolul , în secţiunea destinată descrierii anchetelor sociologice)   Reprezentativitatea efectelor în contexte aplicative Alături de riscurile anterioare ce vizau măsura replicării efectelor, ne putem referi la un tip aparte de dependenţă a efectului de contextul cercetării, când ne referim la validitatea ecologică Aceasta face referire la măsura în care efectele obţinute în studiu pot fi transferate în lumea reală Aşa cum se exprima Brewer ( ), rezultatele obţinute pe populaţii atipice (studenţi la psihologie) şi în contexte artificiale (studii de laborator), nu pot fi considerate ca având o validitate ecologică, până când rezultatele se replică în contexte reale, naturale Din perspectiva validităţii ecologice sunt mai intens apreciate studiile derulate într-un context cât mai natural (realism mundan – de exemplu, în studierea problematicii jocurilor de noroc prin realitate virtuală sau prin studii derulate într-un cazinou) şi îndeosebi cele care implică aspecte psihologice similare cu cele care pot fi întâlnite în viaţa reală de către participanţi (realism psihologic) Din acest punct de vedere, studiile efectuate pot fi analizate din perspectiva gradului lor de similaritate cu realitatea şi/sau cu contextul aplicativ în care se urmăreşte a se analiza dacă s-ar obţine rezultate similare De exemplu, din perspectiva validităţii externe (ecologice), ar exista o probabilitate mai mare să se replice rezultatul privind eficienţa unei intervenţii educaţionale de prevenire a abandonului şcolar prin implicarea şcolarilor în viaţa comunităţii dacă intervenţia ar fi aplicată pe acelaşi grup-ţintă pe care a fost testată iniţial (copii de imigranţi), decât dacă intervenţia ar viza alte categorii de grup-ţintă, cum ar fi copiii proveniţi din familii defavorizate din mediul rural Dinamica relaţiei dintre tipurile de validitate şi tipurile de studii Aşa cum este o aşteptare nerealistă ca un studiu să-şi propună toată pleiada de obiective posibile (exploratorii, descriptive, cauzale), la fel de nerealist este să ne aşteptăm ca un singur studiu să aibă niveluri ridicate de validitate, în toate cele patru aspecte vizate: statistică, internă, de construct şi externă De aceea este important să se acorde o prioritate sporită acelor riscuri privitoare la validitatea concluziilor unui studiu în funcţie de obiectivele urmărite De exemplu, în cercetările fundamentale, în care accentul se pune pe explicarea fenomenelor psihologice studiate, îndeosebi cu privire la sursa unei relaţii de tip cauză-efect, un rol esenţial îl joacă validitatea de construct, respectiv validitatea internă În schimb, în cercetările aplicative, în care obiectivul major vizează măsura în care un anumit efect general îşi găseşte aplicabilitatea în domenii variate, precum în educaţie, în domeniul organizaţional, în sport etc , o importanţă deosebită o are validitatea de construct şi cea externă De asemenea, prin definiţie, studiile efectuate în condiţii de laborator acordă o mai mare atenţie aspectelor care ţin de validitate internă în dauna celei externe, în timp ce studiile de teren vizează îndeosebi aspectele de validitate externă, existând posibilitatea apariţiei riscurilor (aspecte externe rămase necontrolate) privitoare la validitatea internă În sfârşit, cu excepţia validităţii statistice, relevantă pentru orice demers metodologic cantitativ, se poate stabili o oarecare asociere între tipul de obiectiv major vizat de un studiu, anumite particularităţi ale designului său (studii cauzal-descriptive vs studii pragmatice) şi tipul de validitate asupra căruia ar trebui să se acorde mai multă atenţie pentru a atinge obiectivul vizat Tabelul Relaţia dintre obiectivul vizat de studii şi importanţa diferitelor tipuri de validitate Validitate internă Validitate de construct Validitate externă  Obiectiv exploratoriu * ** *  Obiectiv descriptiv * ** **  Obiectiv descriptiv-analitic (transversal) * * **  Obiectiv descriptiv-analitic (longitudinal) ** ** **  Obiectiv cauzal-descriptiv (efficacy) *** * *  Obiectiv cauzal-pragmatic (effectiveness) ** ** ***  Obiectiv cauzal-explicativ (mecanisme cauzale) *** *** *  Legendă: *** rol esenţial; ** rol important; * rol redus De exemplu, în studiile cu cel mai înalt nivel de rigurozitate (cele care îşi propun un obiectiv cauzal-explicativ), pentru a oferi o interpretare corectă cu referire la mecanismului cauzal responsabil pentru apariţia efectului, sunt esenţiale atât aspectele ce ţin de validitatea internă („există într-adevăr o relaţie cauzală?”), cât şi cele care privesc validitatea de construct („explicaţia pentru relaţia cauzală este validă?”) În schimb, în studiile care vizează doar identificarea unei relaţii de tip cauză-efect, fără a se centra pe validarea unor mecanisme cauzale responsabile pentru acest fapt, accentul poate fi pus fie pe demonstrarea clară a eficienţei unei intervenţii (prin controlul variabilelor potenţial confundate, în cadrul unor studii cauzal-descriptive – efficacy), fie pe demonstrarea clară a faptului că intervenţia este eficientă într-un context real (printr-un control mai redus asupra variabilelor potenţial confundate şi o grijă sporită pentru validitatea ecologică, în cadrul unor studii pragmatice – effectiveness) În schimb, aspectele de validitate internă îşi reduc din importanţă în cazul unor studii care îşi propun obiective de tip descriptiv, deoarece prin definiţie acest obiectiv nu vizează extinderea concluziilor dincolo de aspectul pur descriptiv sau predictiv, în timp ce validitatea internă este centrată spre a identifica care dintre relaţiile descrise sunt de tip cauză-efect De aceea, în cazul studiilor cu obiective descriptive, ar fi de dorit să se acorde o importanţă mai mare aspectelor care vizează validitatea de construct şi celor referitoare la validitatea externă Aceste precizări sunt importante în descrierea limitelor unui studiu şi în importanţa acordată subiectului respectiv în secţiunea de discuţii a unui articol Astfel, dacă studiul este unul de tip non-experimental, corelaţional, se poate preciza, desigur, că nu se poate stabili clar dacă relaţia identificată este una cauzală sau de alt tip Ceea ce contează însă este măsura în care relaţia este identificată la nivelul ei real de intensitate (validitate statistică), faptul că măsurătorile utilizate în studiu surprind corect constructele utilizate (validitate de construct) şi că rezultatele sunt utile, cu valoare aplicativă ridicată pentru a fi implementate în practică (validitate externă, ecologică) În schimb, dacă studiul respectiv este unul experimental, ce urmăreşte un obiectiv cauzal-explicativ, accentul din partea de discuţii este pus pe demontarea eventualelor riscuri privitoare la validitatea internă, respectiv privitoare la validitatea de construct De exemplu, în cazul în care studiul urmăreşte să testeze dacă cogniţiile iraţionale autodepreciative sunt mecanisme cauzale responsabile pentru eficienţa terapiei raţional-emotive în combaterea depresiei majore este important să arătăm că: (a) nu există alţi factori externi intervenţiei care să se constituie ca explicaţii plauzibile pentru efectul apărut (istoric – alt tratament urmat concomitent, maturare – remiterea spontană a simptomelor etc ); (b) nu există alte explicaţii concurente valide, intrinseci intervenţiei (efectul se menţine dacă controlăm statistic efectul placebo, diferenţele de aşteptări din partea experimentatorului, sau alte tipuri de cogniţii iraţionale măsurate, decât cele autodepreciative) Ca urmare a celor precizate anterior şi a faptului că în multe situaţii există un cost al creşterii unei anumite forme de validitate, singura soluţie viabilă pentru a răspunde treptat la toate riscurile posibile privitoare la problema investigată este aceea de a iniţia un program de cercetare (un set organizat de studii) menit să răspundă treptat la toate tipurile de risc existente la adresa întrebării de cercetat (Shadish et al , ) Cel mai adesea, demersul porneşte de la un studiu care prezintă rezultate interesante (obiectiv descriptiv sau explorator) Acesta este urmat de o serie de studii menite să confirme relaţia şi intensitatea mărimii efectului observat (validitate statistică), iar apoi de studii care să arate că asocierea se bazează pe o relaţie de tip cauză-efect (validitate internă) Apoi urmează studii care să ofere explicaţii valide pentru relaţia cauzală identificată (validitate de construct) şi care să stabilească cât de robust este efectul şi în ce contexte (limite) apare (validitate externă) Alteori demersul este unul invers, cum ar fi situaţiile în care se observă un efect robust în diferite contexte şi pe diferite populaţii, cu privire la asocierea dintre nivelul de epuizare emoţională şi performanţa profesională (validitate externă) Aceste rezultate pot conduce mai apoi la un program de cercetare în care să se stabilească dacă relaţia este una cauzală (validitate internă), cât de intensă este (validitate statistică) şi cum poate fi ea explicată (validitate de construct) O exemplificare a unui astfel de program de cercetare este oferită în caseta , în care se combină atât studii de laborator, cât şi experimente efectuate în medii naturale În sfârşit, în încheierea secţiunii destinate celor patru tipuri de validitate, trebuie subliniată şi în acest caz logica demersului ştiinţific Validitatea unui efect (privită în ansamblu) este un proces cumulativ bazat pe studii succesive Validitatea nu este niciodată demonstrată, ci doar sprijinită prin rezultatele obţinute şi prin măsurile de control implementate prin design Caseta O ilustrare a programului de cercetare – relaţia cauzală dintre dispoziţia afectivă şi altruism (stările pozitive inducând o creştere a altruismului; adaptare după Brewer, ) Programul debutează cu o constatare rezultată dintr-un studiu empiric corelaţional: indivizii cu o dispoziţie afectivă mai bună şi cei mai optimişti obţin scoruri mai ridicate la o scală de altruism, aşadar între cele două există o legătură O parte importantă din program este destinată derulării unor studii experimentale în condiţii de laborator cu scopul de a identifica cu claritate faptul că o dispoziţie afectivă pozitivă induce o creştere a nivelului de altruism Pentru a da robusteţe acestor rezultate, studiile experimentale variază modalitatea de manipulare a VI: în unele studii participanţii citesc pasaje de text, unele vesele, altele triste; în alte situaţii ascultă muzică pop energizantă cu mesaj optimist sau sunt alocaţi audierii unor melodii melancolice, lente, cu mesaj trist; iar în alte situaţii primesc un feedback pozitiv sau unul negativ O situaţie similară apare şi cu referire la VD măsurate, acestea variind de la scale consacrate de măsurare a nivelului de altruism la situaţii experimentale induse – generozitatea financiară dovedită faţă de o cauză aparent nerelaţionată cu studiul (ajutarea sinistraţilor în urma unor inundaţii) sau disponibilitatea de a oferi ajutor unui complice al experimentatorului Toate aceste variaţii înregistrate în studiile experimentale de laborator converg, susţinând că dispoziţia afectivă pare a modifica nivelul de altruism Cu toate acestea, unele critici aduse experimentelor de laborator, scot în evidenţă riscuri precum: (a) caracterul artificial al unor sarcini; (b) situaţia caracteristicilor sarcinii, aspecte ce pot afecta validitatea externă a rezultatelor, lipsind dovezi cu privire la validitatea ecologică Pentru a elimina aceste critici în contextul păstrării ideii manipulării VI, esenţială pentru studiile care vizează obiective cauzale, a fost dezvoltat un cvasiexperiment derulat în context natural Astfel, o parte dintre participanţi (studenţi) a vizionat un film evaluat într-o etapă de pretestare pe un alt lot de studenţi ca fiind trist, iar o altă parte dintre participanţi (studenţi) a vizionat un film care în pretestare a fost evaluat ca fiind neutru (lotul de control) La ieşirea de la cinematograf erau amplasate urne ale Crucii Roşii, unde participanţii puteau dona bani pentru o cauză nobilă Suma era la latitudinea fiecăruia, nivelul de generozitate financiară constituind VD a studiului O problemă cu acest studiu a fost distorsiunea de selecţie (participanţii şi-au ales singuri ce film vor să vizioneze, ei nefiind distribuiţi randomizat în cele două condiţii, pentru a reduce la minimum eventualul impact al reactivităţii participanţilor) Astfel, până după momentul părăsirii locaţiei unde se putea dona pentru Crucea Roşie, situată la ieşirea de la film, aceştia nu bănuiau că sunt participanţi într-un studiu psihologic Mai mult, pentru a controla eventuale diferenţe în privinţa nivelului de altruism existent de la început între cele două grupe constituite după principii neprobabilistice, în anumite seri locaţia unde se putea dona pentru Crucea Roşie era amplasată la intrarea la film Datele au arătat că, deşi nu erau diferenţe semnificative statistic între cele două loturi înainte de vizionarea filmelor, ele există şi replică rezultatele obţinute în laborator dacă analiza se face pentru situaţiile în care donarea avea loc la ieşirea de la film Toate aceste studii converg spre a susţine relaţia cauzală dintre dispoziţia afectivă şi nivelul de altruism, moment în care programul de cercetare poate trece la următorul nivel, de oferire clară a unor dovezi că dispoziţia afectivă şi nu alte constructe asociate acesteia este într-adevăr responsabilă (explicaţia) pentru modificarea nivelului de altruism Problema validităţii în studiile bazate pe o metodologie calitativă Toate aspectele tehnice discutate în secţiunile precedente, de la la , vizează diferite tipuri de validitate aplicabile în cadrul studiilor empirice bazate pe o metodologie cantitativă (cu accent pe studiile experimentale) În cazul studiilor care utilizează o metodologie calitativă, problema validităţii inferenţelor formulate pe baza datelor colectate rămâne de actualitate, chiar dacă ea este conceptualizată altfel În acest context, discuţia nu se pune în termenii clasici ai celor patru tipuri de validitate, ci prin strategiile specifice metodelor calitative de validare a inferenţelor formulate, cu toate că şi în acest caz putem vorbi despre interpretări alternative, replicarea rezultatelor, distorsiuni şi artefacte Primul lucru care trebuie înţeles de toată lumea este că metodologia calitativă are o logică diferită de cea cantitativă, de aceea nu trebuie judecată după criterii de evaluare specifice validităţii din studiile cantitative Kazdin ( ) afirma că, spre deosebire de metodologia cantitativă care este interesată să simplifice lucrurile (câţi participanţi sunt, ce răspunsuri medii au obţinut, dacă sunt diferenţe între grupele analizate în medii controlate), metodologia calitativă urmăreşte mai degrabă să dezvolte (să complice) lucrurile, pentru a înţelege fenomenul studiat aşa cum apare el în contextul său natural Termeni precum semnificaţie, înţelesuri, reprezentări, care împărtăşesc toate ideea unor evaluări subiective, constituie puncte centrale într-un demers calitativ Această modalitate de a face cercetare poate părea că induce ambiguitate şi un subiectivism excesiv, unei persoane obişnuite exclusiv cu abordarea cantitativă Pe de altă parte, deşi există un grup minoritar de autori care fac o opinie separată, cei mai mulţi, la care subscriu şi eu, consideră că studiile calitative pot fi foarte utile numai în anumite scopuri de cercetare, cu precădere să ajute la descrierea (scop descriptiv) sau la înţelegerea şi interpretarea fenomenelor studiate (scop exploratoriu) În privinţa obiectivelor cauzale, studiile calitative pot fi utile între anumite limite: (a) fie pentru a genera teorii (explicative) şi ipoteze de cercetare care să fie verificate prin studii cantitative; (b) fie ca metode complementare celor cantitative, în cadrul unor metodologii mixte menite să ajute la găsirea de explicaţii pentru relaţiile cauzale analizate (ca urmare a descrierilor bogate obţinute de la participanţi şi a interpretărilor şi semnificaţiilor oferite de către aceştia) Ca urmare a acestor precizări rezultă şi cele cinci tipuri de validitate specifice unei metodologii calitative (Maxwell, ), sintetizate în tabelul Dintre acestea, primele trei reprezintă tipuri primare de validitate (importante pentru validitatea inferenţelor din studiu), iar ultimele două reprezintă tipuri secundare de validitate (importante mai degrabă pentru a creşte încrederea sau percepţia că rezultatele studiului sunt valide) În categoria tipurilor secundare de validitate ar mai putea fi incluse aspecte calitative precum bogăţia, expresivitatea sau profunzimea descrierilor şi interpretărilor (Whittemore, Chase şi Mandle, ) Tabelul Scurtă explicitare a tipurilor de validitate întâlnite în studiile calitative Validitate descriptivă Vizează măsura în care au fost colectate (înregistrate) corect datele oferite de participanţi Este nivelul cel mai simplu de validitate implicat şi singurul care priveşte realitatea factuală, nu pe cea construită Are în vedere descrierea acurată a faptelor povestite, aşa cum s-au întâmplat acestea Exemplu ipotetic: participantul a declarat că a aruncat cu un pet de plastic după profesor Mijloace de validare: de verificat pe înregistrările audio dacă informaţia transcrisă este una corectă (nu au fost distorsionate sau omise elemente descriptive importante) Riscuri: codarea eronată a datelor; probleme în colectarea datelor Validitate interpretativă Vizează acurateţea semnificaţiei acordate actului descris Sunt oferite interpretări corecte pornind de la opiniile, intenţiile şi trăirile descrise de participanţi Vizează aspecte ale realităţii construite pornind de la date factuale Exemplu ipotetic: participantul a recurs la acest gest ca un semn de frondă (rezistenţă) faţă de încercările profesorului de constrângere a acestuia Mijloace de validare: interpretarea este validă dacă respectă perspectiva oferită de actorii implicaţi şi dacă, preferabil, se atinge consensul (participanţii oferă aceeaşi interpretare gestului respectiv) Riscuri: similare cu cele întâlnite în operaţionalizarea constructelor teoretice Validitate teoretică Se oferă explicaţii abstracte pentru comportamentul descris şi interpretat prin apelul la diverse teorii sociale sau psihologice, mergându-se dincolo de perspectiva participanţilor Este nivelul care implică cel mai mult capacitatea cercetătorului de a extrage esenţialul, de a sesiza patternuri care să conducă la insighturi valoroase despre fenomenul studiat, de a face legături între datele colectate şi anumite modele teoretice care facilitează descrierea, înţelegerea, interpretarea şi explicarea fenomenului studiat Exemplu ipotetic: aruncarea petului înspre profesor semnifică un act de frondă din partea elevului, acest comportament făcând parte dintr-o simptomatologie mai largă ce se referă la degradarea continuă a statutului profesorului în societatea actuală românească şi la o criză a valorilor învăţate în şcoala de astăzi Observaţie! Prima parte din exemplu, aruncarea petului ca act de rezistenţă, poate fi perceput ca un demers invers întâlnit în validitatea de construct (rezistenţa fiind constructul vizat, iar actul de aruncare a petului, modalitatea de operaţionalizare) În schimb, cea de-a doua parte a exemplului (rezistenţa ca parte a unei crize majore a sistemului educaţional actual, a degradării statutului profesorului) ar putea fi analizată din perspectiva validităţii interne, astfel că preocuparea de bază devine aceea de a elimina alte posibile „cauze” care să explice rezistenţa elevului Acest lucru pare la prima vedere un demers eminamente speculativ, însă el poate fi corectat de către cercetător prin punerea în comun (triangulare) a celorlalte informaţii de care dispune, câteva zeci de pagini de transcrieri a interviurilor de profunzime efectuate Mijloace de validare: explicaţia este validă dacă (a) este recunoscută de către participanţi ca o cauză posibilă, preferabil atingându-se consensul, (b) teoria utilizată pentru a explica fenomenul studiat este fundamentată empiric (există dovezi în sprijinul acesteia) Riscuri: distorsiunea indusă de cercetător, omiterea datelor discrepante faţă de modelul teoretic propus, omiterea unor explicaţii alternative Validitate externă (generalizare) Prin aceasta se urmăreşte măsura în care modul de descriere, interpretare şi/sau explicare a fenomenului studiat poate fi relevant (valabil) şi pentru alte persoane sau contexte De reţinut însă că nu sunt căutate interpretări valabile pentru toţi participanţii la studiu, ci pentru cât mai mulţi dintre ei, recunoscându-se unicitatea şi viziunea individuală a fiecăruia În acest sens, generalizarea poate avea în vedere măsura în care explicaţia teoretică utilizată are sens, nu numai pentru un alt participant, ci şi pentru alte comportamente specifice (decât aruncarea petului) Ideea generalizării în studiile calitative nu se rezumă doar la aspecte tehnice precum obţinerea unor rezultate similare pe alţi participanţi sau utilizând alte metode de cercetare pentru colectarea datelor, ci urmăreşte, îndeosebi gradul de extindere (valabilitate) a interpretărilor şi a explicaţiilor teoretice oferite Exemplul ipotetic: aruncarea petului este numai unul dintre actele de frondă făcute; la acesta se adaugă distrugerea mobilierului şcolar, negocierea notelor cu profesorul, preluarea apelurilor telefonice în timpul orei; toate acestea converg către ideea unei crize majore a sistemului educaţional de azi Mijloace de validare: măsura în care în urma studiului, aspectele generale (abstracte) sunt potrivite pentru a descrie contexte specifice, în care situaţii particulare pot fi descrise, interpretate sau explicate prin apelul la un nivel categorial superior (aruncarea petului – categorie inferioară vs act de indisciplină – categorie superioară) sau mai abstract de analiză şi care să fie relevant pentru cât mai mulţi participanţi Riscuri: reproductibilitate scăzută a rezultatelor şi interpretărilor formulate Validitate evaluativă Prin aceasta se urmăreşte validitatea interpretărilor pe care le face cercetătorul faţă de comportamentele observate Astfel, dacă validitatea interpretativă oferă perspectiva participanţilor cu privire la semnificaţia comportamentelor descrise, validitatea evaluativă se referă la punctul de vedere al cercetătorului, la semnificaţiile pe care el sau ea le acordă comportamentelor observate Acest tip de implicare subiectivă a cercetătorului, inclusiv la nivelul acordării unor semnificaţii diferite de cele ale participanţilor, este o acţiune legitimă în cercetarea calitativă Exemplu ipotetic: gestul elevului este un strigăt de ajutor, o modalitate de semnalizare a prezenţei sale şi a faptului că a fost neglijat de către profesor Mijloace de validare: nivelul de suport existent în datele colectate pentru aprecierile subiective făcute Riscuri: similare cu cele specifice validităţii de construct; transfer şi proiecţii personale, fără legătură cu datele colectate Alături de aspectele menţionate anterior, în aprecierea studiilor calitative au fost introduse o serie de concepte relevante pentru problematica validităţii De exemplu, conceptul de triangulare se referă la utilizarea unor proceduri sau surse multiple de informare care converg pentru a susţine aceeaşi concluzie Utilizarea ei ca tehnică de lucru creşte probabilitatea validării inferenţelor pentru toate tipurile de validitate, oferind mai multă plauzibilitate descrierilor, interpretărilor şi explicaţiilor oferite Strâns legat de acest concept este cel de credibilitate O interpretare este credibilă dacă este făcută într-o manieră coerentă, cursivă şi în care, atât participanţii, cât şi cercetătorul, se regăsesc ca descriere În sfârşit, un alt concept important este cel de reproductibilitate, care vizează măsura în care un alt cercetător decât cel implicat ar putea ajunge la aceleaşi concluzii, ca urmare a unui demers transparent şi sistematizat de colectare şi analiză a datelor (Kazdin, ) Împreună, indiferent de nivelul de validitate vizat, plauzibilitatea, credibilitatea şi reproductibilitatea, contribuie semnificativ la considerarea inferenţelor formulate ca fiind unele valide O perspectivă pragmatică asupra ciclului natural de cercetare În linii mari, în marketing există o linie directoare clară care porneşte de la analiza nevoilor clienţilor şi identificarea unei nevoi de satisfăcut, continuată cu dezvoltarea unui produs/serviciu care să răspundă acestora, cu stabilirea unei strategii de marketing legate de lansarea acestuia şi apoi de strategii de câştigare a unei cote cât mai mari de piaţă Acelaşi lucru se întâmplă şi în domeniul tehnologiei Ca urmare a extinderii cunoaşterii ca rezultat al cercetărilor fundamentale, poate fi concepută şi mai apoi testată eficienţa unei inovaţii menite să amelioreze sau să optimizeze o anumită tehnologie, prin care să se răspundă mai bine nevoilor existente pe piaţă După numeroase testări sunt eliminate problemele identificate şi este realizat prototipul final Acesta este prezentat clienţilor interesaţi direct, care pot decide să treacă la producţia de serie În psihologie nu există obişnuinţa de a se gândi în termenii unei priviri de ansamblu, cum ar fi aceea de a urmări etapele cunoaşterii de la identificarea unei probleme psihologice până la stadiul final de diseminare şi oferire de servicii, incluzând cele mai eficiente soluţii identificate pentru problema respectivă Între motivele care contribuie la această situaţie este faptul că un ciclu complet (de la cercetare fundamentală, la cercetare aplicativă, iar mai apoi la cercetare pentru dezvoltare – inovare) durează semnificativ mai mult (uneori o viaţă de om) decât situaţia tipică legată de ciclul de viaţă al unui produs sau serviciu în marketing sau în inginerie Un alt motiv îl constituie relativa focalizare a cercetătorilor, fie în zona cercetării fundamentale, fie în cea a cercetării aplicative Însă absenţa unei gândiri pragmatice cu privire la ciclul natural al cercetării pe o anumită tematică din psihologie nu ar trebui să persiste, datorită beneficiilor multiple pe care le aduce o astfel de perspectivă pragmatică de ansamblu Din acest punct de vedere, figura sintetizează toate caracteristicile principale urmărite printr-un astfel de demers, având drept fir logic de start focalizarea pe cunoaşterea problemei investigate (cel mai adesea adresabilă prin cercetarea fundamentală), iar ca punct final demersuri specifice cercetării aplicative şi cercetării pentru dezvoltare-inovare (focalizarea pe identificarea de soluţii care să îmbunătăţească starea de fapt) Din punctul de vedere al tipului de studii efectuate, în partea stângă a figurii se regăsesc într-o mai mare măsură studii care urmăresc obiective exploratorii sau descriptive, deoarece procesul de cunoaştere evoluează gradual dinspre clarificarea problemei investigate înspre identificarea mecanismelor cauzale responsabile pentru apariţia ei Obiectivele cauzal-descriptive, respectiv cauzal-explicative se pot întâlni în întregul ciclu de studiu al unei problematici, fiind însă măsuri obligatorii pentru studiile focalizate pe intervenţii (soluţiile oferite – partea din dreapta a figurii ) Aşadar, logica ştiinţifică apelează adesea la un asemenea demers, întâi apărând preocuparea pentru a conceptualiza fenomenul studiat, iar mai apoi de a găsi soluţiile aplicative potrivite care să amelioreze problema constatată  Figura Ciclul ştiinţific natural al studierii unui aspect psihologic – o viziune pragmatică Pentru a înţelege ciclul de cunoaştere al unei tematici, voi ilustra prin tema epuizării emoţionale (burnout) descrisă pentru prima dată în anii ‘ , care a cunoscut o expansiune extraordinară (peste de publicaţii; Schaufeli, Leiter şi Maslach, ) Tabelul Ilustrarea aspectelor centrale din ciclul natural ştiinţific în cazul problematicii epuizării emoţionale (burnout) Aspecte generale (obiective vizate) Ilustrare la nivelul studierii epuizării emoţionale  Descrierea şi definirea problemei (obiective exploratorii sau obiective descriptive propriu-zise) Cele mai întâlnite tipuri de studii care răspund acestor nevoi sunt studiile de caz şi studiile bazate pe o metodologie calitativă Aceste demersuri sunt menite să faciliteze înţelegerea fenomenului studiat şi să identifice atributele caracteristice, necesare şi definitorii pentru fenomenul semnalat Această etapă este obligatorie pentru orice construct studiat, fiind faza în care se ajunge (de cele mai multe ori) la un consens cu privire la definirea şi sfera de includere a constructului respectiv Conceptul de burnout a fost introdus la mijlocul anilor ‘ de Maslach ( ), respectiv Freudenberger ( ), ca o primă încercare de sistematizare a unei serii de studii de caz şi a unor observaţii din practica organizaţională, conform căreia o parte din angajaţi ajung să fie extenuaţi mental şi să le scadă nivelul de implicare în muncă, aceasta pierzându-şi din semnificaţie Pe baza acestor studii exploratorii şi descriptive s-a ajuns la o definire a conceptului (Maslach, ) şi la o descriere a procesualităţii fazelor de burnout (Freudenberger, apud Kaschka, Korczak şi Broich, )  Extinderea şi gravitatea problemei (obiective descriptive propriu-zise sau descriptiv-analitice) Într-o societate care acţionează în baza unui model cu resurse limitate ar fi ideal să se stabilească gradul de răspândire a problemei identificate şi direcţia evoluţiei acesteia (de exemplu, o problemă tot mai des întâlnită) prin studierea prevalenţei fenomenului (numărul de cazuri existente) şi a incidenţei acestuia (numărul de cazuri nou-apărute), precum şi a consecinţelor (costurilor) la nivel social, economic etc Cele mai întâlnite tipuri de studii din această sfera sunt studiile non-experimentale descriptive, cum ar fi sondajele de opinie, studiile corelaţionale sau analiza de costuri Problema este destul de răspândită în populaţia generală de angajaţi, fiind observată o prevalenţă a fenomenului la un grad de severitate ridicat (burnout clinic) cuprins între % şi %, ce poate ajunge chiar la % în profesiile care presupun un contact uman susţinut (cadre didactice, medici de familie, comercianţi etc ) (Schaufeli, ) Prin gravitatea consecinţelor existente la nivel personal, burnoutul a fost inclus în ICD- , iar prin consecinţele negative la nivel de organizaţie (fluctuaţie de personal, absenteism, scăderea satisfacţiei în muncă) a devenit o preocupare curentă pentru specialiştii în resurse umane (Kaschka et al , )  Operaţionalizarea conceptului (obiective descriptiv-analitice) În această categorie intră studiile metodologice centrate pe dezvoltarea, adaptarea sau rafinarea unor instrumente psihologice necesare pentru a măsura constructul evaluat (studii descriptiv-analitice) Ele se află în strânsă legătură cu definirea şi descrierea problemei, respectiv cu stabilirea şi identificarea unei reţele (conexiuni) teoretice între constructul examinat şi alte constructe relevante Instrumentul de bază utilizat pentru a măsura nivelul epuizării emoţionale este MBI (Maslach Burnout Inventory) (Maslach şi Jackson, apud Schaufeli, ) Acesta are trei versiuni: una pentru cadre didactice, alta pentru alte profesii ce implică contact uman frecvent (oferirea de servicii), iar cea de-a treia versiune, generală, pentru alte tipuri de slujbe Toate acestea redau cele trei dimensiuni majore ale conceptului: cel de extenuare, cel de depersonalizare şi cel de realizări personale scăzute (ineficienţă) Deşi au fost dezvoltate alte instrumente concurente, multe dintre acestea sunt focalizate doar pe surprinderea extenuării ca o subcomponentă a epuizării emoţionale, neglijând partea care vizează distanţarea faţă de muncă (prin depersonalizare şi ineficienţă)  Construirea reţelei teoretice (obiective descriptiv-analitice) În această categorie intră studiile orientate spre construirea reţelei nomotetice dintre constructul analizat şi alte constructe relevante De exemplu, studiile orientate spre validarea incrementală, cele de validitate convergentă sau divergentă, intră în această categorie Tot aici s-ar include şi studiile non-experimentale focalizate pe identificarea de moderatori sau mediatori ai relaţiei dintre constructul măsurat şi alte variabile Maslach, Schaufeli şi Leiter ( ) trec în revistă o serie de distincţii importante între burnout şi alte constructe similare cum ar fi stresul la locul de muncă, suprasolicitarea, insatisfacţia legată de locul de muncă sau depresia Opusul ideii de burnout ar fi cea de angajament organizaţional În sfârşit, se stabilesc relaţii între burnout şi o multitudine de variabile din zona organizaţională precum ambiguitatea de rol, conflictul de rol, relaţiile cu colegii şi cu superiorii, nivelul de absenteism, satisfacţia la locul de muncă, comportamentele contraproductive etc Aceeaşi autori subliniază că stima de sine scăzută sau un locus al controlului extern joacă in rol moderator, facilitând apariţia burnoutului  Identificarea factorilor protectivi şi ai celor de risc (obiective descriptiv-analitice şi obiective cauzal-descriptive) Această direcţie de studii poate fi inclusă în categoria construirii unor reţele teoretice, însă am preferat abordarea ei distinctă pentru a sublinia faptul că se are în vedere găsirea acelor determinanţi (factori) care pot facilita sau inhiba apariţia fenomenului respectiv Printr-un asemenea demers predictiv, situat la graniţa dintre un demers descriptiv şi unul cauzal, pot fi identificate categoriile vulnerabile (persoane care prezintă multipli factori de risc şi nu dispun ca resurse de factorii protectori) şi se pot testa anumite presupoziţii cu privire la cauzele apariţiei fenomenului respectiv, cu limitările metodologice de rigoare Studiile non-experimentale transversale, dar mai ales cele longitudinale, fie ele de tip corelaţional sau comparativ, sunt studiile utilizate cel mai des pentru a surprinde potenţialii moderatori sau mediatori ai fenomenului studiat În acest caz se apelează îndeosebi la studii non-experimentale longitudinale, care permit identificarea clară a ordinii în succesiunea trăirilor psihice De exemplu, este burnoutul o consecinţă a unei satisfacţii scăzute la locul de muncă sau este o cauză care contribuie la scăderea satisfacţiei legată de muncă? Burnoutul are drept consecinţe o serie de manifestări negative precum depresia, anxietatea etc sau este un rezultat al acestor stări? În pofida importanţei acestor răspunsuri, există puţine studii longitudinale pe această temă (Schaufeli, ) Ele par a sugera o cauzalitate reciprocă în cazul aspectelor de sănătate (stările negative facilitează burnotul, care la rândul său întreţine o stare psihică negativă) şi induc o serie de consecinţe negative la nivel organizaţional (insatisfacţie profesională) Studiile de tip longitudinal pot induce însă în eroare din cauza naturii cronice a burnoutului În lipsa unei variabilităţi în scorurile de la MBI, îndeosebi în cazul operaţionalizării de natură categorială (prezent vs absent), pot apărea eronat, asocieri nesemnificative statistic cu alţi factori de risc sau protectori Alternativa la studiile longitudinale vizează implementarea unor modele structurale (de exemplu, analiza de cale) în cadrul unor studii non-experimentale transversale, prin care o serie de caracteristici ale locului de muncă (de exemplu, autonomia decizională etc ) au fost conceptualizate ca antecedenţi ai burnoutului, în timp ce alţi factori (de exemplu, atitudinea negativă faţă de locul de muncă) sunt percepute drept consecinţe ale acestui fenomen  Dezvoltarea de modele teoretice integrative în scop predictiv/explicativ (analiza mecanismelor schimbării) (orice tip de obiectiv, preferabil obiective de tip cauzal-explicativ) Pe măsura acumulării de cunoştinţe despre fenomenul studiat, îndeosebi a dezvoltării reţelei de constructe teoretice şi a determinanţilor (factori de risc, factori protectori) pentru efectul observat, se pot dezvolta modele sau teorii care să prezică şi/sau să explice evoluţia fenomenului studiat Cel mai adesea, pentru a testa asemenea modele se apelează la studii experimentale ce-şi propun scopuri cauzal-explicative, însă atunci când acest lucru nu este posibil sunt luate în considerare dovezi indirecte provenite din alte tipuri de studii Din punct de vedere teoretic au fost dezvoltate mai multe modele explicative pentru apariţia burnoutului (la nivel individual, la nivel interpersonal, la nivel organizaţional şi la nivel societal), însă pentru foarte puţine dintre acestea există un suport empiric direct (Schaufeli, ) Una dintre cele mai cunoscute conceptualizări vede epuizarea emoţională ca o consecinţă a inegalităţii schimburilor de la locul de muncă (angajaţii resimt că au dăruit/s-au implicat prea mult, comparativ cu cât au primit înapoi, fiind vorba astfel de un efort nerăsplătit, indiferent dacă avem în vedere şeful direct sau întreaga organizaţie ca sursă a insatisfacţiei) (Schaufeli, ) Un alt model celebru a fost dezvoltat de Demerouti et al ( ), burnoutul fiind considerat rezultatul unui dezechilibru între solicitările de la locul de muncă şi resursele psihologice disponibile pentru a face faţă la acestea Presiunea indusă de solicitări conduce îndeosebi la extenuare, în timp ce lipsa resurselor contribuie îndeosebi la dezangajare în sarcină (scăderea implicării)  Designul intervenţiilor şi testarea eficienţei acestora (obiective cauzal-descriptive) În urma acumulării unui număr mare de cunoştinţe despre problema studiată, pot fi concepute şi evaluate o serie de programe menite să diminueze sau să elimine problema respectivă Modalitatea standard de testare a eficienţei intervenţiilor propuse este apelul la studii cauzal-descriptive (efficacy studies) Van der Klink, Blonk, Schene şi Van Dijk ( ) au efectuat o metaanaliză privind eficienţa intervenţiilor menite să reducă nivelul de burnout, rezultate încurajatoare fiind obţinute pentru programele cognitiv-comportamentale şi, secundar, pentru intervenţiile bazate pe tehnici de relaxare Totuşi, se observă că cele mai multe intervenţii utilizate nu sunt specifice exclusiv burnoutului, ci vizează aspecte mai generale cum ar fi combaterea depresiei, a stresului etc (Schaufeli, )  Identificarea mecanismelor schimbării (obiective cauzal-explicative) Dacă împreună cu testarea eficienţei unei intervenţii se iau măsuri suplimentare de a identifica ingredientul activ, responsabil pentru apariţia schimbării, se urmăresc obiective cauzal-explicative Modalitatea standard de testare a acesteia presupune studii cauzal-descriptive, având un design special care să permită identificarea mecanismelor schimbării Nu au fost identificate studii care să includă explicit măsuri de testare a unor mecanisme cauzale odată cu testarea eficienţei unei intervenţii la nivel de burnout De fapt, de cele mai multe ori burnoutul a fost utilizat ca un construct de tip „umbrelă” pentru a explica relaţia dintre un factor antecedent (de exemplu, ambiguitatea de rol) şi o consecinţă (de exemplu, insatisfacţia profesională)  Adaptarea şi optimizarea soluţiilor (obiective cauzal-descriptive) În urma derulării studiilor cauzal-descriptive şi a celor cauzal-explicative, identificăm cu claritate dacă intervenţia este una eficientă şi care sunt ingredientele active (mecanismele responsabile pentru eficienţă) Însă aceste rezultate nu asigură faptul că intervenţia este eficientă în orice context şi pe participanţi neselectaţi special Nu sunt clare nici limitele eficienţei intervenţiei (variabilele moderatoare) De aceea, pentru a răspunde acestor neajunsuri se apelează la studii pragmatice (effectiveness studies) Prin acest gen de studii se are în vedere evidenţierea robusteţii eficienţei intervenţiei în contexte naturale variate, pornind de la premisa că este importantă reproducerea efectelor în condiţii asemănătoare cu cele din realitate Majoritatea studiilor efectuate pentru a testa eficienţa intervenţiilor menite să reducă nivelul de epuizare emoţională se constituie, în realitate, ca studii pragmatice, derulate în mediul natural al participanţilor şi fără criterii dure de includere/excludere a celor chestionaţi din analiză Aşadar se poate spune că intervenţiile respective sunt eficiente inclusiv în condiţii asemănătoare cu cele din realitate Dintre intervenţiile analizate, cele care combină intervenţii la nivelul individului cu măsuri ameliorative la nivel organizaţional conduc la efecte benefice pe o perioadă mai lungă de timp decât cele implementate doar la nivel individual (Awa, Plaumann şi Walter, )  Diseminarea protocoalelor de intervenţie în practică Această componentă de cercetare, specifică categoriei cercetare-inovare-dezvoltare, vizează implementarea în activitatea practică a intervenţiilor care au trecut de filtrele anterioare Dincolo de aspectul transferului de servicii psihologice inovative în practica profesională, în acest stadiu se pot avea în vedere studii cantitative sau calitative menite să identifice măsura în care beneficiarii acestor intervenţii le acceptă şi apreciază (complianţa la intervenţie), precum şi analize focalizate pe avantaje colaterale (cum ar fi un echilibru mai ridicat muncă-viaţă de familie) sau pe câştigul obţinut aşa cum rezultă în urma unei analize de cost-eficienţă În domeniul consultanţei manageriale (atât la nivelul companiilor de top ca Deloitte, Bain, BCG sau McKinsey, cât şi a firmelor mici de consultanţă) se pot oferi pachete de intervenţie menite să reducă nivelul de burnout Ele pot avea ca suport diseminarea celor mai bune practici în domeniu, menite să reducă nivelul de epuizare emoţională în una sau mai multe arii precum motivare, autonomie, valori etc prezentate în manuale de profil precum Maslach şi Leiter ( ) sau Leiter şi Maslach ( ) La fel de utile se pot dovedi şi programele generale de îmbunătăţire a sănătăţii mentale, cu efecte pozitive indirecte şi la nivel de burnout De exemplu, programul de reducere a stresului bazat pe meditaţie mindfulness este aplicat în peste de organizaţii din lumea întreagă cu scopul de a preveni burnoutul (Goutas, )   Întrebarea studiului – strategii de selectare a ideilor de cercetat Lecturând literatura de specialitate pe o anumită tematică, ni s-a întâmplat poate multora dintre noi să ajungem să afirmăm că s-au scris atât de multe despre tema respectivă încât nu ar mai putea fi nimic nou de spus Scopul acestei secţiuni finale a capitolului destinat analizei critice a demersului de cercetare este de a oferi sugestii celor interesaţi cu privire la posibile idei de cercetat, inclusiv în acele domenii care par a fi deja bătătorite Desigur, o primă posibilitate este oferită de modelul pragmatic al ciclului ştiinţific natural, descris în secţiunea anterioară În baza acestuia pot fi adresate o serie de întrebări precum: „cât de extinsă este problema (prevalenţa)?”, „care sunt factorii de risc antecedenţi?”, „există intervenţii eficiente pentru a preveni şi/sau combate problema?” etc O altă posibilă viziune este schematizată în figura , reprezentând o adaptare după Howitt şi Cramer ( ) Conform acestuia, una dintre sursele generative de idei de cercetare este analiza critică a cercetărilor existente pentru a evalua: (a) măsura în care afirmaţiile conţinute au acoperire empirică (sunt valide intern, extern, la nivel de construct şi statistic), propunând, acolo unde este cazul, noi studii cu metodologii adecvate, menite să corecteze eventualele aspecte rămase descoperite; (b) măsura în care rezultatele obţinute converg spre acelaşi rezultat sau conduc la rezultate mixte, contradictorii, propunând fie sinteze de tip metaanalitic pentru a surprinde efectul mediu global şi eventualii factori mediatori sau moderatori, fie studii empirice cu un design care să ofere explicaţii/sugestii cu privire la sursa efectelor contradictorii obţinute Tot din analiza literaturii de specialitate pot rezulta idei de cercetare provenite din: (a) sugestiile oferite de autorii studiilor cu privire la posibile direcţii viitoare de studiu; (b) testarea unor afirmaţii (conţinuturi teoretice) care nu au fost abordate empiric sau care au fost tratate într-o manieră insuficientă pentru a putea aprecia gradul de sprijin empiric existent pentru acestea În sfârşit, a treia categorie de surse de idei vizează o abordare diferită de cele anterioare Dacă în cazurile precedente ideile de cercetare erau bazate pe un fundament teoretic solid şi constituie cel mai adesea un demers logic de tip deductiv (dinspre teoretic spre empiric), idei de cercetare pot rezulta şi printr-un demers de tip inductiv, de la o realitate relevantă de cercetat spre o conceptualizare teoretică ulterioară Aici ar putea intra (a) atât nevoia de a oferi răspunsuri la probleme noi cu care se confruntă societatea actuală (de exemplu, studierea eficienţei terapiilor realizate online, a impactului reţelelor de comunicare socială de tipul Facebook asupra vieţii de cuplu etc ), (b) cât şi ideile având drept sursă insighturi personale, precum şi problemele de zi cu zi cu care se confruntă cercetătorul (de exemplu, dacă cercetătorul observă din activitatea de consultanţă că persoanele agreabile primesc în general evaluări mai bune din partea supervizorilor decât cele mai puţin agreabile, îşi poate pune problema dacă agreabilitatea este într-adevăr un predictor al performanţei profesionale sau dacă relaţia evidenţiază o distorsiune în evaluare, aceea de a evalua mai intens pozitiv pe cei cu un stil de relaţionare interpersonală plăcut)  Figura Ciclul ştiinţific natural al studierii unui aspect psihologic – o viziune pragmatică Dată fiind importanţa acordată problemelor de validitate ale unei cercetări prezentate pe parcursul acestui capitol, voi oferi câteva detalii despre modul concret în care pot fi găsite idei de cercetare pornind de la analiza validităţii concluziilor unui studiu Cel mai probabil, această sursă de idei are cel mai ridicat nivel de fertilitate, îndeosebi în contextul actual de cercetare, în care suntem confruntaţi cu o explozie de studii care ne determină să credem că este dificil să aducem contribuţii originale, că lucrurile importante despre un subiect de cercetat au fost spuse deja Lista acestor propuneri este prezentată în tabelul , fără a avea pretenţia de a fi o listă exhaustivă Tabelul Idei de studiu pornind de la analiza validităţii rezultatelor studiilor anterioare Tip de situaţie Simptomatologie (ilustrare)/Soluţie (ilustrare)  Efect nedetectat Ipoteza studiului nu este sprijinită, nefiind obţinută o corelaţie semnificativă statistic între nivelul de conştiinciozitate şi performanţa în muncă  Validitate statistică Posibile cauze pentru această stare de fapt sunt restricţia de amplitudine sau o consistenţă internă scăzută a variabilelor măsurate şi, în general, o putere statistică scăzută asociată ipotezei testate Soluţia: de aplicat aceeaşi idee de cercetare pe un lot mai mare şi mai eterogen, cu instrumente având proprietăţi psihometrice superioare  Validitate internă Cu toate că aspectele de validitate internă au în vedere validarea afirmaţiilor de tip cauzal, am putea discuta şi în cazul acestui studiu corelaţional de probleme de instrumentare De exemplu, dacă evaluarea performanţelor în muncă se face de către supervizori diferiţi, după bunul lor plac, fără a exista o metodologie comună de apreciere, se pot introduce erori de instrumentare care să conducă la rezultate nesemnificative statistic Soluţia: preferabilă ar fi utilizarea unor indicatori hard (obiectivi) de apreciere a performanţei în muncă sau apelul la un training de profil şi la nişte ancore comportamentale de evaluare, dacă se apelează la evaluări soft (subiective)  Validitate de construct O posibilă explicaţie ar fi utilizarea unui instrument mai puţin cunoscut (eventual cu probleme privind validitatea convergentă) pentru a măsura conştiinciozitatea Soluţia: atât pentru conştiinciozitate, cât şi pentru aprecierea performanţelor ar trebui utilizate instrumente consacrate sau alte metode decât cele utilizate iniţial (de exemplu, măsuri obiective ale criteriului în locul evaluărilor oferite de supervizori); o altă direcţie posibilă ar viza descompunerea constructului conştiinciozitate pentru a urmări care dintre faţetele sale (de exemplu, prudenţa) corelează sau nu cu performanţa în muncă  Validitate externă Este posibil ca relaţia dintre conştiinciozitate şi performanţă în muncă să fie nesemnificativă pentru că s-a apelat la un lot de actori Soluţia: se replică studiul apelând la un lot de sportivi de performanţă sau pe un lot de consultanţi financiari; se poate modifica contextul testării, aplicându-se proba în context de selecţie, nu într-unul tipic situat temporal la momentul postselecţiei  Efect detectat Ipoteza studiului este susţinută, un nivel mai ridicat al anxietăţii sociale fiind înregistrat în cazul celor din grupul de control de tipul listei de aşteptare comparativ cu cei din grupul experimental, care au urmat trainingul de asertivitate  Validitate statistică Cel mai probabil, acest tip de validitate nu ridică probleme în cazul descris cu două excepţii: (a) situaţia raportărilor selective (limităm discuţia la sfera anxietăţii sociale şi concluzionăm că trainingul este unul eficient, deşi nu au apărut diferenţe între cele două grupe cu privire la alte variabile studiate precum asertivitatea, empatia, stima de sine etc , singura diferenţă înregistrată fiind la nivelul anxietăţii sociale – care ar fi putut ieşi semnificativă statistic din întâmplare – eroarea setului de comparaţii); (b) situaţia puţin probabilă a derulării studiului cu o ipoteză de lucru căreia îi este asociată o putere statistică foarte mare Soluţia: alegerea unei variabile dependente principale şi derularea studiului în condiţiile unei puteri statistice optime  Validitate internă Dacă rezultatul a fost obţinut în absenţa randomizării prealabile a participanţilor, rezultatul poate fi provocat de distorsiuni de selecţie Dacă există randomizare, este posibil ca rezultatul obţinut să fie cauzat de alte aspecte precum pierderea selectivă a participanţilor (doar % dintre persoanele din lotul de control au fost disponibile pentru evaluare la nivel de postintervenţie comparativ cu % din grupul care a primit intervenţia) Soluţia: apelul la studii randomizate individual sau la nivel de cluster în locul celor de tip cvasiexperimental, cu derularea studiului în mai bune condiţii pentru a evita probleme tipice precum pierderea selectivă a participanţilor, istoricul etc  Validitate de construct Dacă rezultatul este unul pozitiv se pune întrebarea: care ar fi explicaţia pentru acest rezultat? Să fie simplul fapt că indivizii din grupul experimental au beneficiat de atenţie specială? Să fie din cauza faptului că trainingul, prin expunere repetată la situaţii sociale, scade nivelul de stres al participanţilor la studiu, astfel încât aceştia nu mai sunt la fel de anxioşi social? Soluţia: pentru a vedea dacă efectul se datorează trainingului propus şi nu altor factori nespecifici se apelează la un altfel de grup de control, de tipul intervenţiei placebo; pentru a oferi explicaţii privind efectul găsit se pot introduce măsurători ale posibilelor mecanisme ale schimbării, pentru a testa efectul acestora  Validitate externă Poate fi replicat rezultatul în alte contexte? De exemplu, pe subiecţi care au un nivel clinic al anxietăţii sociale? Sau în contextul în care trainingul este livrat colectiv, nu în şedinţe individuale? În ţări cu o cultură colectivistă faţă de cele care au o cultură individualistă? Etc Soluţia: Implementarea programului de training în contexte cât mai variate şi pe participanţi cât mai diferiţi, pentru a urmări gradul de generalizare a rezultatelor  Alte situaţii des întâlnite   Efect stabil robust Din multe studii reiese faptul că terapia cognitiv-comportamentală (TCC) este eficientă pentru a diminua simptomatologia depresivă (rezultate semnificative statistic) Soluţia: Dacă efectul a fost replicat în contexte variate se pot căuta explicaţii (factori mediatori) pentru legătura dintre VI şi VD De exemplu, se poate testa măsura în care un anumit tip de cogniţii iraţionale, precum sunt cele autodepreciative, pot juca rolul unor variabile mediatoare, astfel încât terapia să modifice mai întâi nivelul acestor cogniţii, care la rândul lor au un impact asupra nivelului de depresie  Efect variabil (eterogen) Din studii diferite reies rezultate eterogene, astfel încât în unele cazuri se susţine empiric ideea că TCC are rol benefic în combaterea depresiei, iar în alte studii nu se replică acest rezultat pozitiv, nefiind înregistrate diferenţe semnificative statistic Soluţia: introducerea în studiu a unor variabile moderatoare pentru a analiza situaţiile în care efectul este unul mai puternic, respectiv unul absent sau mai slab dezvoltat  Replicarea conceptuală Într-un studiu s-a demonstrat că vizionarea de filme agresive (grupul experimental) vs filme documentare (grupul de control) conduce la un nivel mai ridicat al agresivităţii de stare măsurată printr-o scală de tip self-report Acest gen de rezultat este cu atât mai robust cu cât poate fi replicat prin apelul la alte modalităţi de operaţionalizare decât cele folosite iniţial Soluţia: de exemplu, cei din grupul experimental sunt amorsaţi cu o serie de cuvinte cu sens din sfera agresivităţii (cuvinte cu o conotaţie agresivă), în timp ce participanţii din grupul de control au fost amorsaţi cu o serie de cuvinte neutre VD a fost evaluată într-o manieră obiectivă, fiind înregistrate numărul de conflicte (agresiuni verbale) într-o sarcină de lucru primită  Concluzii În acest capitol au fost discutate principalele elemente necesare pentru a înţelege dimensiunea cercetării ştiinţifice în psihologie Cu toate că sunt precizate aspecte specifice pentru metodologiile calitative, accentul este pus pe studiile care utilizează o metodologie cantitativă, acesta fiind curentul majoritar în domeniul psihologiei Însă indiferent de tipul de cercetare avut în vedere, aprecierea calităţii acesteia nu se face luând în seamă criterii cantitative superficiale, de genul numărului de ipoteze, a numărului de instrumente utilizate, a complexităţii analizelor statistice etc , ci de măsura în care studiile respective sunt valide Validitatea unui studiu nu este determinată per se, ci are în vedere nuanţe diferite în funcţie de obiectivele sale şi nici nu priveşte studiul în ansamblul său, ci se analizează la nivelul afirmaţiilor (concluziilor) din studiu Astfel un rezultat statistic poate fi valid (validitate statistică), fără a fi însă adevărată relaţia cauzală specificată între variabilele studiate (validitate internă scăzută) La fel, un rezultat poate fi, atât valid statistic, cât şi clar din perspectiva unei relaţii cauzale, însă explicaţia oferită pentru această stare de fapt să fie una greşită (validitate de construct scăzută) În sfârşit, chiar dacă rezultatul este semnificativ statistic şi indică o relaţie cauzală bazată pe o explicaţie corect identificată, este posibil ca efectul observat să aibă un grad scăzut de generalizare (transfer) în alte contexte (validitate externă scăzută) Aşadar, în analiza validităţii trebuie urmărite toate cele patru forme ale sale, îndeosebi pe acelea cu cel mai ridicat nivel de relevanţă pentru un anumit tip de studiu În acest sens, studiile pot viza obiective exploratorii, obiective descriptive, obiective cauzale şi obiective explicative (cauzal-explicative) În funcţie de obiectivul vizat de un anumit studiu pot fi deosebit de importante anumite tipuri de validitate: (a) de construct (pentru obiective exploratorii); de construct, externă şi statistică (pentru obiective descriptive); internă (pentru obiectivele cauzale); internă şi de construct (pentru obiective cauzal-explicative) În sfârşit, din perspectiva designului utilizat, studiile cu un nivel ridicat de rigurozitate, precum sunt experimentele, necesită o atenţie deosebită aspectelor ce ţin de validitatea internă şi a celei de construct Cunoaşterea în profunzime a aspectelor legate de validitatea unei cercetări este importantă nu numai din perspectivă critică, ci şi pentru a identifica idei viitoare de cercetare În sfârşit, deoarece niciun studiu nu poate răspunde perfect tuturor riscurilor posibile pentru toate formele de validitate, se recomandă la nivelul unui studiu individual centrarea pe acele aspecte ale validităţii importante pentru a răspunde adecvat întrebării studiului Numai programele de cercetare pe o anumită temă pot răspunde adecvat şi în timp (pe rând), la fiecare dintre posibilele limite sesizate Pe baza mai multor asemenea programe de studii se poate ajunge la completarea unui ciclu întreg de studii cu referire la problematica investigată În cadrul capitolului am prezentat ciclul natural ştiinţific de abordare a unei probleme într-o manieră pragmatică Acesta poate fi descris succint prin două mari faze: (a) faza de cunoaştere a problemei şi (b) faza de soluţionare a problemei Lecturi suplimentare Alan E Kazdin ( ) Research design in clinical psychology (ediţia a IV-a) Boston, USA: Allyn & Bacon Capitolele , şi ale cărţii tratează pe larg problematica celor patru tipuri de validitate şi a distorsiunilor legate de activitatea de cercetare în general Referinţa este îndeosebi utilă celor interesaţi de domeniul clinic, prin ilustrările pe care le conţine, însă ideile şi principiile enunţate sunt valabile pentru orice domeniu de cercetare psihologică William R Shadish, Thomas D Cook, Donald T Campbell ( ) Experimental and quasi-experimental designs for generalized causal inference Boston, USA: Houghton Mifflin Company Cartea reprezintă într-o manieră actualizată informaţiile prezentate în volumele clasice din domeniu cum ar fi Cook şi Campbell ( ), tratând într-o manieră extensivă problematica validităţii unei cercetări din perspectiva afirmaţiilor pe care le incumbă John W Creswell ( ) Qualitative inquiry & Research design Choosing among five approaches Londra, UK: Sage Publications Recomand această lucrare pentru cei interesaţi să îşi dezvolte abilităţile de cercetare calitativă Pe parcursul lucrării sunt prezentate pe larg cinci dintre cele mai cunoscute tipuri de cercetare calitativă: abordarea narativă (cum ar fi istoria orală), fenomenologia, cercetările etnografice, teoria generată (grounded theory) şi studiul de caz intensiv Podsakoff, P M , MacKenzie, S M , Podsakoff, N P ( ) Sources of method bias in social science research and recommendation on how to control it Annual Review of Psychology, , pp - Articolul prezintă impactul pe care îl exercită distosiunea metodei comune, probabil cea mai întâlnită problemă legată de validitatea de construct, asupra rezultatelor statistice obţinute, precum şi o serie de măsuri, menite să reducă sau să controleze nivelul acestei distorsiuni Bibliografie Aronson, E , Mills, J ( ) The effect of severity of initiation on liking for a group Journal of Abnormal and Social Psychology, , pp - Awa, W , Plaumann, M , Walter, U ( ) Burnout prevention: A review of intervention programs Patient Education and Counseling, , pp - Bedos C , Pluye P , Loignon, C , Levine, A ( ) Qualitative research În E Lesaffre, J Feine, B Leroux, D Declerck (eds ), Statistical and methodological aspects of oral health research (pp - ) West Sussex, UK: John Wiley and Sons Bontilă, G ( ) Tehnica testării psihologice Bucureşti: Editura Cartea Românească Brewer, M B ( ) Research design and issues of validity În H T Reis, C M Judd (eds ), Handbook of research methods in social and personality psychology (pp - ) New York: Cambridge University Press Campbell, D T , Stanley, J C ( ) Experimental and quasi-experimental designs for research on teaching În N L Gage (ed ), Handbook of research on teaching (pp - ) Chicago: Rand McNally Carroll, K M , Nich, C , Sifry, R L , Nuro, K F , Frankforter, T L , Ball, S A et al ( ) A general system for evaluating therapist adherence and competence in psychotherapy research in the addictions Drug and alcohol dependence, , pp - Cook, T D Campbell, D T ( ) Quasi-experimentation Design & analysis issues for field settings Chicago: Rand McNally Cordray, D S , Pion, G M ( ) Treatment strength and integrity: Models and methods În R R Bootzin, P E , McKnight (eds ), Strengthening research methodology: Psychological measurement and evaluation (pp - ) Washington, DC: American Psychological Association Creswell, J W ( ) Qualitative Inquiry & Research Design Choosing among five approaches Londra: Sage Publications Creswell, J W ( ) Educational research: Planning, conducting, and evaluating quantitative and qualitative research (ediţia a III-a) Upper Saddle River, NJ: Pearson David, D ( ) Metodologia cercetării clinice Fundamente Iaşi: Editura Polirom David, D , Szentagotai, A , Lupu, V , Cosman, D ( ) Rational emotive behavior therapy, cognitive therapy, and medication in the treatment of major depressive disorder: A randomized clinical trial, post-treatment outcomes, and six-month follow-up Journal of Clinical Psychology, , pp - De Houwer, J ( ) A conceptual and theoretical analysis of evaluative conditioning The Spanish Journal of Psychology, , pp - Demerouti, E , Bakker, A B , Nachreiner, F , Schaufeli, W B ( ) The job demands-resources model of burnout Journal of Applied Psychology, , pp - Elliott, R , Timulak, L ( ) Descriptive and interpretative approaches to qualitative research În J Miles, P Gilber, (eds ), A Handbook of Research Methods for Clinical and Health Psychology (pp - ) Marea Britanie: Oxford University Press Elmes, D G , Kantowitz, B H , Roediger, H L ( ) Research methods in psychology (ediţia a IX-a) St Paul, MN: West Freudenberger, H J ( ) The staff burnout syndrome in alternative institutions Psychotherapy: Theory, Research and Practice, , pp - Gawronski, B , Payne, B K (eds ) ( ) Handbook of implicit social cognition: Measurement, theory, and applications New York: Guilford Press Gilbert, P , Irons, C ( ) Thinking about research: issues and dilemmas În J Miles, P Gilber, (eds ), A Handbook of Research Methods for Clinical and Health Psychology (pp - ) Marea Britanie: Oxford University Press Goutas, L J ( ) Bournout The Write Stuff, , pp - Greenwald, A G , McGhee, D E , Schwartz, J L K ( ) Measuring individual differences in implicit cognition: The Implicit Association Test Journal of Personality and Social Psychology, , pp - Heppner, P P , Wampold, B E , Kivlighan, D M , Jr ( ) Research design in counseling (ediţia a III-a) Belmont, CA: Thomson Brooks/Cole Howitt, D , Cramer, D ( ) First steps in research and statistics: A practical workbook for psychology students Londra: Routledge Kantowitz, B H , Roediger, H L , III, Elmes, D G ( ) Experimental Psychology Cheriton House, UK:Cengage Learning Kaschka, W P , Korczak, D , Broich, K ( ) Burnout: a fashionable diagnosis Deutsches Ärzteblatt, , pp - doi: /arztebl Kazdin, A E ( ) Single-case Research Designs: Methods for Clinical and Applied Settings (ediţia a II-a) New York: Oxford University Press Kerlinger, F N , Lee, H B ( ) Foundations of behavioral research (ediţia a IV-a) Holt, NY: Harcourt College Publishers Kraemer, H C ( ) Pitfalls of multisite randomized clinical trials of efficacy and effectiveness Schizophrenia Bulletin, , pp - Laverty, S M ( ) Hermeneutic phenomenology and phenomenology: A comparison of historical and methodological considerations International Journal of Qualitative Methods, ( ) Găsit la adresa http://www ualberta ca/~iiqm/backissues/ final/pdf/laverty pdf Leiter, M P , Maslach, C ( ) Banishing burnout: Six strategies for improving your relationship with work San Francisco, CA: Jossey-Bass LeLorier, J , Gregoire, G , Benhaddad, A , Lapierre, J , Derderian, F ( ) Discrepancies between metaanalyses and subsequent large randomized, controlled trials The New England Journal of Medicine, , pp - doi: /NEJM Maslach, C ( ) Burned-out Human Behavior, , pp - Maslach, C ( ) Burnout: A social psychological analysis În J W Jones (ed ), The burnout syndrome (pp - ) Park Ridge, IL: London House Maslach, C , Leiter, M P ( ) The truth about burnout San Francisco, CA: Jossey-Bass Maslach, C , Schaufeli, W B , Leiter, M P ( ) Job burnout Annual Review of Psychology, , pp - doi: /annurev psych Maxwell, J A ( ) Understanding and validity in qualitative research Harvard Educational Review, , pp - Olantunji, B O , Lohr, J M , Sawchuk, C N , Westendorf, D H ( ) Using facial expressions as CSs and fearsome and disgusting pictures as UCSs: affective responding and evaluative learning of fear and disgust in blood-injection-injury phobia Journal of Anxiety Disorders, , pp - Pelham, B W , Blanton, H ( ) Conducting research in psychology: Measuring the weight of smoke (ediţia a III-a) Belmont, CA: Wadsworth/Thomson Podsakoff, P M , MacKenzie, S M , Lee, J , Podsakoff, N P ( ) Common method variance in behavioral research: A critical review of the literature and recommended remedies Journal of Applied Psychology, , pp - Podsakoff, P M , MacKenzie, S M , Podsakoff, N P ( ) Sources of method bias in social science research and recommendation on how to control it Annual Review of Psychology, , pp - Raudenbush, S W , Liu, X ( ) Statistical power and optimal design for multisite randomized trials Psychological Methods, , pp - Sava, F ( / ) Analiza datelor în cercetarea psihologică Metode statistice complementare Cluj-Napoca: ASCR Sava, F A (ed ) ( ) Metode implicite de investigare a personalităţii Iaşi: Editura Polirom Schaufeli, W B ( ) Past performance and future perspectives of burnout research South African Journal of Industrial Psychology, , - Schaufeli, W B , Leiter, M P , Maslach, C ( ) Burnout: years of research and practice Career Development International, , pp - doi: / Scifres, C M , Iams, J D , Klebanoff, M , Macones, G A ( ) Metaanalysis vs large clinical trials: which should guide our management? American Journal of Obstetrics & Gynecology, , p Shadish, W R , Cook, T D , Campbell, D T ( ) Experimental and quasi-experimental designs for generalized causal inference Boston: Houghton Mifflin Singera, R A , Zentall, T R ( ) Preference for the outcome that follows a relative aversive event: Contrast or delay reduction? Learning and Motivation, , pp - Susser, E , Schwartz, S , Morabia, A , Bromet, E ( ) Psychiatric epidemiology: Searching for the causes of mental disorders New Zealand: Oxford University Press Steckler, A , McLeroy, K R , Goodman, R M , Bird, S T , McCormick, L ( ) Toward integrating qualitative and quantitative methods: An introduction Health Education Quarterly, , pp - Sweldens, S , van Osselaer, S M J , Janiszewski, C ( ) Evaluative conditioning procedures and the resilience of conditioned brand attitudes Journal of Consumer Research, , pp - doi: / Tashakkori, A , Teddlie, C ( ) Mixed methodology: Combining qualitative and quantitative approaches (Applied Social Research Methods, Nr ) Thousand Oaks, CA: Sage Turok, K D , Espez, E , Edelman, A B , Lotke, P S , Lathrop, E H , Teal, S B , Jacobson, J C , Simonsen, S E , Schulz, K F ( ) The methodology for developing a prospective metaanalysis in the family planning community Trials, , p doi: / - - - Trochim, W M ( ) The Research Methods Knowledge Base (ediţia a II-a) Găsit la la adresa http://www socialresearchmethods net/kb/index php van der Klink, J J, Blonk, R W , Schene, A H , van Dijk, F J ( ) The benefits of interventions for work-related stress American Journal of Public Health, , pp - Whittemore, R , Chase, S K , Mandle, C L ( ) Validity in qualitative research Qualitative Health Research, , pp - Wikipedia ( ) Effort justification Găsit la data de la adresa: http://en wikipedia org/wiki/ Effort justification În ţările dezvoltate, orice proiect de cercetare poate fi implementat doar după ce primeşte aprobarea din partea unei comisii de etică a cercetării (IRB – Institutional Review Board) O asemenea practică a început să fie implementată recent şi la noi, vezi cazul Universităţii „Babeş-Bolyai” din Cluj-Napoca În plus, pentru a putea derula cercetări pe subiecţi umani, unele instituţii solicită cercetătorilor să obţină/să facă dovada existenţei unui certificat de absolvire cu succes a unui curs despre protejarea participanţilor la cercetare Un exemplu de astfel de curs în limba engleză, ce poate fi urmat gratuit de oricine, este disponibil la http://phrp nihtraining com/users/overview php În acest sens, în special în domeniul ştiinţelor medicale se vorbeşte tot mai des despre cercetarea translaţională ca un tip de cercetare liant între cea fundamentală şi cea aplicată, având rolul de a grăbi transferul rezultatelor obţinute în cercetarea fundamentală (de exemplu, anumite descoperiri din biologia moleculară) în zona clinică (a studiilor randomizate), precum şi de a asigura feedbackul invers, astfel încât anumite probleme stringente în zona clinică să determine agenda cercetării din zona fundamentală Acest tip de cercetare necesită expertiză avansată şi o abordare interdisciplinară Pentru a ilustra şi mai clar consecinţele aplicării unei metodologii inadecvate vom apela la exemplul oferit de David ( ) cu privire la Moş Crăciun Astfel, dintr-o cercetare efectuată în paradigma hermeneutică cu privire la portretul psihologic al lui Moş Crăciun la copiii de - ani am concluziona corect (fiind vorba de credinţele lor) că: (a) există probe despre existenţa lui Moş Crăciun; (b) dacă îl vom îmbuna, fiind cuminţi, vom primi mai multe cadouri Cu alte cuvinte, rezultatele studiului nu arată că aşa stau lucrurile (că Moş Crăciun există), ci că copiii cred că Moş Crăciun există Printr-un demers pozitivist, am afla însă că Moş Crăciun nu există (ce realitate dură!) Acest exemplu poate părea ilar, pentru că toţi cititorii acestei cărţi cunosc această diferenţă, însă dacă ne referim la aspecte psihologice complexe supuse cercetării, vom observa cazuri în care cercetătorii confundă realitatea observată cu realitatea construită (luând credinţele participanţilor drept adevăruri pentru a susţine, de pildă, că plecarea părinţilor la muncă în străinătate cauzează tulburări emoţionale copiilor rămaşi acasă) Pericolul acestui tip de confuzie este cu atât mai mare, cu cât credinţele împărtăşite de participanţi par a fi unele rezonabile logic (de exemplu, că programele educaţionale cu privire la conduita în trafic adresate adolescenţilor vor reduce numărul accidentelor în care sunt implicaţi, afirmaţie nesusţinută empiric – vezi exemplul al doilea din caseta , capitolul ) Cu toate acestea, cercetarea credinţelor (a realităţii construite) este la fel de onorabilă şi utilă precum demersurile de tip pozitivist Astfel, pentru activitatea unui consilier şcolar ar fi foarte important să se cunoască modul în care adolescenţii din familii cu părinţi aflaţi la muncă în străinătate, percep şi trăiesc această stare de fapt, respectiv modul în care tinerii se raportează la programele de educaţie rutieră, pentru a le putea îmbunătăţi Distincţiile prezentate în acest tabel au fost făcute în scop pedagogic, pentru a sublinia unele diferenţe între cele două abordări În realitate între cele două viziuni există mai degrabă diferenţe de nuanţă De exemplu, abordarea pozitivistă nu susţine că nu există cunoaştere (realitate) subiectivă, ci doar că analiza acesteia duce la studierea unei realităţi percepute, nu a realităţii obiective Există o distincţie clară între conceptele de metodologie a cercetării, designul cercetării şi metodele de cercetare, relaţia dintre ele fiind una ierarhică În funcţie de metodologia aleasă (de exemplu, o metodologie cantitativă în paradigma pozitivistă), se apelează la un anumit design de cercetare (de exemplu, unul de tip descriptiv, non-experimental, sub forma unui sondaj de opinie), care, la rândul său, presupune utilizarea unor metode de cercetare adecvate (de exemplu, metoda chestionarului) Astfel, Creswell ( ) sintetizează distincţia conceptuală dintre cele trei Prin metodologia cercetării se stabilesc liniile mari prin care se va derula o cercetare ca urmare a unei opţiuni filosofice pentru o paradigmă de cercetare (un mod de a ne raporta şi înţelege lumea şi de a acumula cunoaştere ştiinţifică, fiind lentilele care ne direcţionează spre ce anume privim în lume) Prin designul cercetării se stabileşte un plan de acţiune prin care se încearcă să fie valorificate metodele de cercetare pentru a atinge obiectivele studiului, fiind astfel un nivel intermediar de raportare între aspectele filosofice (din sfera metodologiei cercetării) şi aspectele tehnice (din sfera metodelor de cercetare) Prin metode de cercetare ne referim la tehnici specifice de colectare a datelor, cu implicaţii la nivelul analizei datelor (interviu, observaţie participativă, teste psihologice etc ) Deşi interrelaţionate, nu există o echivalenţă între obiectivele descriptive şi metodele de cercetare utilizate De exemplu, sondajele de opinie pot viza aspecte analitice, în timp ce studiul bazat pe observaţii poate viza obiective de tip exploratoriu În mod similar, studiile de caz (menţionate ca studii exploratorii) pot viza obiective descriptive De exemplu, în studiile experimentale întotdeauna manipularea VI precedă măsurarea efectelor la nivel de VD cauzate de această manipulare De asemenea, în studiile non-experimentale longitudinale, se pot evidenţia legături între factorul cauzal potenţial măsurat la momentul T şi consecinţele asupra variabilei efect la momentul T În unele cazuri, legătura statistică dintre variabile poate fi unidirecţională din punct de vedere logic Un exemplu ar fi asocierea dintre temperatura ambientală ridicată şi un nivel crescut de ostilitate (iritabilitate) Ar fi dificil logic să gândim că pe măsură ce oamenii devin mai iritaţi creşte temperatura mediului ambient, în schimb ar fi logic plauzibil să afirmăm că pe măsură ce creşte temperatura din mediul ambient oamenii devin mai iritaţi (ostili) Pe lângă riscul în sine, constituie pericole la adresa validităţii interne a unui studiu şi interacţiunile dintre distorsiunea de selecţie şi alte riscuri (de exemplu, distorsiunea de selecţie – istoric; distorsiunea de selecţie – maturare etc ) De exemplu, este posibil ca persoanele incluse în grupul experimental să fie mai preocupate de aspectul durerii şi să caute să se informeze în legătură cu tehnici psihologice de reducere a durerii În acest caz ipotetic, cele două grupe vor diferi nu numai în ceea ce priveşte deprinderea tehnicii Lamaze, ci şi în privinţa nivelului de cunoaştere a altor tehnici (recomandări psihologice) menite să reducă durerea Desigur, ideal ar fi să se tindă către standardul maxim aplicabil în domeniul ştiinţelor medicale, îndeosebi al farmacoterapiei, în care studiul experimental cu grup de control activ (intervenţie standard) se derulează în condiţii lipsite de transparenţă (cum ar fi designul triplu orb, în care nici participanţii la studiu, nici cei care pun la dispoziţia participanţilor medicaţia analizată în studiu şi nici asistenţii de cercetare care evaluează efectele obţinute nu ştiu cărei condiţii experimentale îi aparţine cel evaluat) Într-un astfel de design sunt controlate eficient toate riscurile posibile privitoare la validitatea internă a studiului Din păcate, în cazul intervenţiilor psihologice este imposibil de implementat un asemenea studiu, cel puţin cu privire la situaţia celor care livrează intervenţia Totuşi, pot fi luate măsuri în direcţia reducerii transparenţei obiectivului studiului, fie prin aplicarea individuală, fie prin combinarea unor măsuri precum: (a) necomunicarea ipotezei urmărite celor care livrează, respectiv primesc intervenţia; (b) utilizarea unor asistenţi de cercetare pentru colectarea măsurătorilor de tip pretest, interim sau posttest care să nu cunoască nici cărei condiţii experimentale îi aparţine cel examinat şi/sau nici care ar fi ipoteza studiului; (c) utilizarea unor intervenţii nespecifice, credibile pentru participanţii la studiu, pentru a decela efectul placebo de efectul real al intervenţiei Pelham şi Blanton ( ) menţionează o altă distincţie posibilă între validitatea de construct şi validitatea conceptuală Prima vizează mai degrabă legătura dintre concept (construct) şi modul de operaţionalizare al său în cadrul unui studiu (de exemplu, reprezintă seria de desene Ben o modalitate adecvată de operaţionalizare pentru conceptul de desene animate agresive?) În schimb, validitatea conceptuală are un sens mult mai larg şi se referă la măsura în care întregul concept studiat poate fi explicat din perspectiva unei teorii, la măsura în care un întreg set de studii (program de studii) sprijină sau nu o anumită teorie, utilitatea unui anumit concept nou Un alt posibil risc clasic, rar întâlnit la nivelul studiilor publicate în reviste cu prestigiu internaţional, este cel al definirii inadecvate a conceptului studiat, cu consecinţe negative asupra operaţionalizării acestuia În schimb, mai frecvent pot apărea probleme de etichetare a constructului studiat De exemplu, într-un studiu despre relaţia dintre agresivitate şi consumul de filme video violente se pot înţelege prin agresivitate (inclusiv la nivel de operaţionalizare) numai aspecte ce se referă la agresivitatea fizică, fără a socoti alte faţete ale agresivităţii precum agresivitatea verbală sau atitudinea ostilă/pasiv-agresivă Reactivitatea participanţilor este trecută clasic ca un risc privitor la validitatea de construct (Shadish et al , ; Cook şi Campbell, ; Kazdin, ) De exemplu, atunci când obţinem un rezultat semnificativ statistic şi vrem să explicăm rezultatul (scop cauzal-explicativ), nu am şti dacă efectul este cauzat de intervenţie (manipulare experimentală) sau este o consecinţă a reactivităţii participanţilor În sens utilitar însă („este intervenţia eficientă?” „există o relaţie cauză-efect?”), reactivitatea participanţilor constituie un risc la nivelul validităţii interne, fiind un artefact ce creşte probabilitatea apariţiei unei erori de tip I De exemplu, intervenţia poate să nu fie eficientă în realitate, dar rezultatul obţinut să fie unul semnificativ statistic, din cauza reactivităţii participanţilor Un ghid succint, dar foarte util despre debriefing găsiţi la: http://www wadsworth com/psychology d/templates/student resources/workshops/res methd/debrief/debrief html Brewer ( ) semnalează că, într-un studiu bazat pe ameninţarea stimei de sine prin oferirea unui feedback negativ participanţilor pentru un eseu scris, în condiţii controlate de laborator, sarcina are un realism psihologic mai ridicat pentru subiecţi dacă aceştia sunt studenţi decât pentru mineri cu vârsta de peste de ani Cel mai cunoscut cost de acest gen priveşte relaţia dintre validitatea internă şi cea externă Pe măsură ce există mai multă preocupare faţă de controlul variabilelor confundate pentru a creşte validitatea internă, creşte totodată nivelul de artificialitate al cercetării, scăzând astfel validitatea externă O altă relaţie inversă poate fi sesizată între validitatea de construct şi cea internă De exemplu, pentru a evita distorsiuni precum subreprezentarea constructelor sau distorsiunea monometodă, cercetătorul poate apela la măsuri multiple de evaluare a efectului măsurat Acest efect creşte însă timpul de examinare şi intensifică efortul participanţilor în cadrul studiului, fapt care poate conduce la creşterea procentului de participanţi care renunţă la studiu, cu consecinţe negative asupra validităţii interne (diferenţele dintre grupe sunt cauzate de retragerea diferenţiată din studiu) şi a celei externe (prin scăderea reprezentativităţii participanţilor rămaşi în studiu pentru populaţia generală) Cititorii interesaţi de acest aspect al validităţii studiilor calitative pot găsi mai multe detalii, inclusiv despre aspecte specifice ale validităţii pentru diferite tipuri de studii (abordări fenomenologice, abordări narative etc ) în Creswell ( ) Un asemenea ciclu de abordare ştiinţifică a unei probleme poate fi un instrument euristic util în a identifica punctele nevralgice ale unui domeniu de cercetare În cazul specific al burnoutului, existenţa deopotrivă a unor intervenţii specifice, precum şi a celor general valabile pentru îmbunătăţirea stării de sănătate mentală poate fi interpretat ca o consecinţă directă a presiunii venite din lumea practicienilor de a oferi soluţii la probleme în contextul în care nu există studii elocvente cu privire la ingredientele active (mecanismele cauzale) responsabile pentru reducerea nivelului de burnout Ca urmare a acestei stări de fapt, în care balanţa dintre cercetare fundamentală vs cercetare aplicativă înclină evident în favoarea ultimei, se impune sprijinirea mai multor cercetări fundamentale Din acest punct de vedere, ar fi nevoie îndeosebi de o focalizare mai mare asupra obţinerii de dovezi empirice asupra modelelor teoretice dezvoltate pentru a explica burnoutul şi a identificării acelor mecanisme cauzale responsabile pentru prevenirea şi/sau combaterea acestui fenomen nedorit, dar prezent în organizaţiile contemporane Numai în acest fel vom putea să ne asigurăm că avem de-a face cu o abordare pragmatică, validată ştiinţific, iar practicienii nu vor mai putea fi acuzaţi că pun căruţa înaintea cailor, cu alte cuvinte că oferă soluţii pentru o problemă al cărei model teoretic este încă insuficient fundamentat empiric Partea a doua Tipuri majore de studii în cercetarea psihologică Capitolul Studiile experimentale Experimentul – metoda regală în cercetarea ştiinţifică La cele mai multe dintre problemele menţionate pe parcursul primelor două capitole ale acestei lucrări, răspunsurile pot fi oferite prin apel la studii experimentale Spre exemplu, putem analiza credinţa populară conform căreia ascultarea muzicii clasice compusă de Mozart are efecte benefice asupra dezvoltării intelectuale la copii Mai specific, se consideră că ascultarea repetată a acestui tip de compoziţii conduce la potenţarea nivelului de inteligenţă al copiilor care sunt expuşi în mod repetat la această stimulare Studiile non-experimentale, cum ar fi cele de tip corelaţional, nu sunt suficiente pentru a putea susţine ştiinţific o asemenea concluzie, deoarece este posibil ca simpla corelaţie dintre ascultarea muzicii lui Mozart şi coeficientul de inteligenţă a copiilor să fie doar un artefact statistic În spatele ascultării muzicii lui Mozart s-ar putea regăsi situaţia unor familii cu un capital cultural bogat, fapt care facilitează dezvoltarea cognitivă a copilului Singura metodă ştiinţifică prin care se poate demonstra existenţa sau inexistenţa efectului Mozart (şi, în general, eficienţa oricărui tip de intervenţie/tratament) este metoda experimentală Caseta Descrierea dovezilor ştiinţifice legate de efectul Mozart Rauscher, Shaw şi Ky ( ) au publicat rezultatele unui experiment în prestigioasa revistă Nature, prin care se susţinea ideea că muzica lui Mozart conduce la creşterea tranzitorie a performanţei în sarcini specifice pentru a surprinde inteligenţa spaţială În sprijinul acestei concluzii, autorii au prezentat rezultatele unui experiment în cadrul căruia au existat trei grupe de participanţi: cei care au ascultat timp de minute muzica lui Mozart (mai exact sonata pentru două piane K ), cei care au beneficiat timp de minute de un instructaj specific tehnicilor de relaxare şi cei din condiţia neutră, care au stat timp de minute în condiţii de linişte deplină După manipularea variabilei de interes (ascultă sau nu muzica lui Mozart) şi controlul variabilelor potenţial confundate (prin distribuirea randomizată a participanţilor în cele trei grupe experimentale) cercetătorii au evaluat efectul muzicii prin măsurarea performanţei participanţilor în rezolvarea unor sarcini spaţiale din cadrul unui test de inteligenţă (componenta de inteligenţă spaţială) Rezultatele obţinute au uimit lumea ştiinţifică prin faptul că cei care au fost incluşi în grupul celor care au ascultat muzica lui Mozart au obţinut performanţe semnificativ statistic mai bune în sarcinile spaţiale decât cei din celelalte două grupe experimentale, diferenţa fiind de aproximativ - puncte în termeni de IQ, însă efectul erau unul tranzitoriu (se menţinea timp de - minute de la finalizarea expunerii la muzică) Studiile ulterioare au confirmat doar parţial aceste rezultate în sensul că cea mai recentă şi comprehensivă metaanaliză pe această temă, efectuată de Pietschnig, Voracek şi Formann ( ), indică un efect de intensitate moderată spre scăzută (d Cohen egal cu , ) a muzicii lui Mozart comparativ cu performanţa obţinută de cei care aşteptau în linişte (grupul de control), un efect similar fiind însă întâlnit şi dacă erau comparate alte compoziţii muzicale cu performanţele celor din grupul de control Dacă se compara muzica lui Mozart cu alte genuri muzicale, diferenţa era una neglijabilă Mai mult efectele observate sunt într-adevăr tranzitorii, sunt obţinute doar la nivelul componentei spaţiale a IQ şi se bazează îndeosebi pe studii făcute pe populaţie adultă Aceste rezultate nu au afectat însă dezvoltarea unei adevărate industrii de promovare a efectului Mozart pentru copii, susţinută de dorinţa părinţilor de a augmenta nivelul intelectual al copiilor De exemplu, celebrul site Amazon com conţinea în peste de produse (CD-uri) care susţineau că sunt eficiente în producerea efectului Mozart, iar unele state americane au mers până într-acolo încât au votat un proiect de lege care cerea creşelor de stat să pună, în fiecare zi, muzică clasică sugarilor (Florida) sau au creat subvenţii din bugetul statului astfel încât fiecare copil nou-născut să primească gratuit un CD cu muzica lui Mozart (Georgia şi Tennessee) (Lilienfeld et al , ) Orice experiment presupune: (a) manipularea variabilei independente pentru a vedea efectele acestei acţiuni asupra variabilei dependente; (b) controlul variabilelor potenţial confundate în designuri intergrup prin alocarea randomizată a participanţilor în grupele experimentale Când se vorbeşte despre ideea de control în cadrul unui experiment, se pot avea în vedere cel puţin trei niveluri diferite de analiză (Elmes, Kantowitz şi Roediger III, ): (a) nivelul comparativ (prin compararea performanţei grupului experimental cu cea a unui grup de control); (b) nivelul manipulării variabilei independente (VI) (control exercitat prin posibilitatea de a modifica nivelul intensităţii VI/tipul de intervenţie oferită participanţilor la studiu); (c) controlul variabilelor străine (potenţial confundate) care ar putea afecta relaţia de tip cauză-efect studiată (de exemplu, control exercitat prin alocarea randomizată a participanţilor în grupul experimental, respectiv în cel de control) Prin manipularea variabilei independente (cauza) în cadrul unui experiment, cercetătorul exercită un control asupra a ceea ce oferă indivizilor (input), pentru a observa dacă apar modificări în realitate cu privire la efectul studiat (output) De exemplu, se poate urmări dacă performanţa indivizilor la sarcini vizual-spaţiale se modifică în contextul în care variabila-cauză este activă (se ascultă muzică de Mozart) sau inactivă (participanţii aşteaptă în linişte) În plus, poate fi testat aspectul de specificitate (doar muzica lui Mozart, orice tip de muzică clasică sau muzica, în general, produce aceste efecte) De asemenea, prin alocarea randomizată a participanţilor în grupele experimentale, cercetătorul exercită un control asupra variabilelor potenţial confundate ce pot afecta rezultatele studiului Este vorba de controlul acelor variabile care pot influenţa efectul urmărit – performanţa la sarcini spaţiale Acest control se obţine prin egalizarea stării de fapt existente în grupele experimentale cu referire la variabile precum atitudinea faţă de muzica clasică, dispoziţia afectivă, nivelul de cultură al participanţilor, nivelul IQ-ului lor general etc , aspect obţinut prin alocarea randomizată a participanţilor în grupele experimentale Dată fiind relevanţa definitorie pentru orice studiu experimental a conceptului de relaţie cauză-efect, precum şi a mijloacelor utilizate pentru atingerea acestui scop – manipularea variabilei cauză (independente), respectiv controlul variabilelor străine, vom prezenta, în cele ce urmează, fiecare dintre aceste concepte fundamentale pentru studiile experimentale Despre relaţia cauză-efect în psihologie De obicei, cei mai mulţi dintre noi avem o predilecţie de a gândi în termenii unei relaţii de tip cauză-efect Ne-am îmbolnăvit pentru că organismul nostru era slăbit ca urmare a lipsei de odihnă, avem probleme de somn pentru că suntem prea stresaţi, am promovat un examen dificil ca urmare a efortului depus de a învăţa la disciplina respectivă, copilul vecinului este neastâmpărat pentru că părinţii acestuia nu se ocupă suficient de educaţia lui etc De multe ori, acest tip de argumentare este considerată a fi suficientă în gândirea uzuală pentru a concluziona asupra cauzelor respective că sunt suficiente pentru apariţia unui anumit eveniment Într-o abordare ştiinţifică, relaţia de tip cauză-efect este una mult mai complexă, pornind inclusiv de la faptul că variabila-cauză poate avea o altă semnificaţie decât aceea a unei condiţii necesare şi suficiente pentru a produce un anumit fenomen Pentru a explica ideea cauzalităţii în ştiinţă, vom apela la exemplul oferit de Shadish, Cook şi Campbell ( ) cu privire la cauzele apariţiei unui incendiu într-o pădure Un incendiu poate avea cauze multiple, cum ar fi un chibrit aprins aruncat în iarbă, un foc de tabără nesupravegheat, un fulger etc Niciuna dintre aceste posibile cauze nu este necesară (de exemplu, un incendiu poate apărea şi în situaţii în care nu este vorba despre un foc de tabără), nici suficientă (de exemplu, un foc de tabără nesupravegheat, pentru a se transforma în incendiu, ar trebui să fie însoţit de o serie de condiţii favorabile explicite, cum ar fi prezenţa unor lemne sau frunze uscate, sau implicite, cum ar fi prezenţa oxigenului pentru combustie) Astfel cauza potenţială (chibritul aprins aruncat în iarbă, focul de tabără nesupravegheat, fulgerul etc ) face parte dintr-o constelaţie de factori necesari pentru apariţia efectului – incendierea pădurii Din acest punct de vedere, aceste cauze potenţiale au fost denumite condiţii „inus” de către Mackie ( apud Shadish et al , ), adică o condiţie insuficientă, neredundantă, ca parte a unei condiţii nenecesare, dar suficiente Să ilustrăm aceste cuvinte abstracte prin exemplul incendierii pădurii Lăsarea nesupravegheată a unui foc de tabără aprins reprezintă o condiţie insuficientă pentru a porni un incendiu, în absenţa altor factori favorizatori, dar este o acţiune neredundantă, contribuind într-o manieră unică la explicarea unei părţi însemnate dintre incendiile declanşate de-a lungul timpului, alături de alte cauze potenţiale posibile Totuşi, lăsarea nesupravegheată a focului de tabără poate fi privită ca parte a unui întreg (alături de existenţa de lemne şi frunze uscate, absenţa ploii etc ) ce reprezintă o condiţie suficientă pentru pornirea incendiului, dar nu şi necesară, deoarece pot exista şi alţi factori responsabili pentru apariţia incendiului O denumire alternativă pentru această perspectivă despre cauzalitate este oferită de Riegelman ( ), prin conceptul de condiţie contributivă Din acest punct de vedere, o cauză poate fi contributivă dacă modificarea variabilei-cauză afectează variabila-efect, cu precizarea că nu întotdeauna o modificare a variabilei-cauză se soldează cu modificări ale variabilei-efect, la fel cum nici orice caz protejat de acţiunea variabilei-cauză nu este scutit de apariţia efectului De aceea, în psihologie majoritatea relaţiilor de tip cauză-efect nu descriu relaţii deterministe (în care variabila-cauză este necesară şi suficientă pentru a produce un anumit efect), ci se referă la relaţiile de tip cauză-efect ca la nişte condiţii contributive, pe care evaluările sistematice bazate pe metaanaliză (vezi capitolul ) încearcă să le desluşească, subliniind variabilele de tip mediator sau moderator care descriu dinamica relaţiei dintre variabilele de tip cauză şi cele de tip efect De asemenea, o altă distincţie utilă pentru domeniul psihologiei este aceea de a diferenţia între relaţiile cauzale cu rol descriptiv şi relaţiile cauzale cu rol explicativ (Shadish et al , ) Dintre cele două, mult mai uşor de demonstrat sunt relaţiile cauzale de tip descriptiv, cum ar fi evidenţierea faptului că muzica lui Mozart poate fi eficientă în îmbunătăţirea performanţelor la probe cognitive spaţiale Pentru acest lucru este suficient să realizăm un studiu experimental care să compare nivelul performanţei la sarcini spaţiale al celor din grupul care a beneficiat două ore de muzica lui Mozart cu cel al indivizilor incluşi într-un grup placebo, care a beneficiat de muzica clasică a altor compozitori, dar prezentată ca fiind muzica lui Mozart Cu alte cuvinte, este suficient să demonstrăm că variaţii ale variabilei independente (cauză) efectuate într-un context controlat, precum cel specific studiilor experimentale, produc modificări la nivelul efectului urmărit în direcţia aşteptată În schimb, mult mai dificil de demonstrat este cazul unei relaţii cauzale de tip explicativ, în care se încearcă să se stabilească motivul pentru care relaţia cauzală este una funcţională Astfel, dacă într-o relaţie cauzală descriptivă obiectivul fundamental este acela de a verifica dacă există o relaţie de tip cauză-efect, într-o relaţie cauzală explicativă obiectivul fundamental devine acela de a identifica motivele care stau în spatele relaţiei cauzale (care anume dintre caracteristicile asociate muzicii lui Mozart constituie elementul activ, responsabil pentru îmbunătăţirea performanţei la sarcini spaţiale – o creştere a capacităţii de atenţie concentrată asupra sarcinii de rezolvat; o creştere a activităţii corticale pentru ariile cerebrale responsabile pentru procesarea informaţiilor spaţiale; inducerea unei dispoziţii afective pozitive care descarcă sistemul cognitiv de alocarea unor resurse spre direcţii nerelevante cum ar fi cazul anxietăţii de performanţă etc ) Detalii despre distincţia dintre studiile cu obiective cauzal-descriptive şi cele cu obiective cauzal-explicative au fost oferite în capitolul anterior (secţiunea ) Controlul prin manipularea variabilei independente Prin manipularea variabilei independente (VI), se înţelege decizia cercetătorului de a varia nivelul variabilei-cauză pentru a observa efectele apărute pornind de la premisele bazale conform cărora pentru a putea vorbi despre o relaţie de tip cauză-efect trebuie să observăm că: (a) modificările la nivelul VI se soldează cu modificări la nivelul variabilei dependente (VD); (b) modificările la nivelul VI le precedă pe cele apărute la nivelul VD De pildă, un cercetător interesat să evidenţieze relaţia dintre consumul de calorii şi greutatea corporală poate decide să varieze consumul de calorii (de exemplu, grupul experimental să consume jumătate din numărul de calorii consumat de grupul de control) Un cercetător care doreşte să compare eficienţa a două tipuri de psihoterapie, cognitiv-comportamentală vs familial-sistemică, în combaterea depresiei majore va decide să varieze tipul de psihoterapie urmată de către participanţii la studiu, astfel încât unii dintre aceştia să urmeze şedinţe de terapie cognitiv-comportamentală, iar alţii şedinţe de terapie familial-sistemică Se observă, aşadar, intervenţia activă a cercetătorului, care poate decide care vor fi aspectele supuse manipulării De exemplu, chiar în contextul în care participanţii sunt supuşi aceluiaşi tip de stimuli, manipularea poate avea în vedere instructajul oferit, timpul avut la dispoziţie pentru rezolvarea sarcinii, nivelul beneficiilor oferite participanţilor la studiu etc Important din acest punct de vedere este să fie manipulat, pe rând, câte un singur element diferenţiator per grup experimental Dacă se încalcă acest principiu, interpretarea rezultatelor are de suferit, deoarece ajungem să vorbim despre variabile confundate De exemplu, dacă se compară eficienţa terapiei cognitiv-comportamentale (TCC) aplicată individual cu terapia psihodinamică (P) de grup pentru a ameliora anxietatea socială, nu vom putea interpreta acurat rezultatele cu privire la care dintre cele două forme de psihoterapie ar fi mai eficientă, deoarece este posibil ca diferenţele la nivel de efect sesizate să fie cauzate de celălalt factor distinctiv dintre grupe – modalitatea de implementare: individuală, respectiv în grup Soluţia pentru asemenea situaţii, în care se doreşte manipularea a mai mult decât o singură dimensiune, presupune trecerea de la un plan de bază unifactorial la planuri multifactoriale De exemplu, într-un plan bifactorial (conţine două variabile independente) se poate răspunde adecvat la mai multe întrebări precum: (a) „care formă de psihoterapie urmată (TCC vs P) este mai eficientă?”; (b) „care modalitate de implementare (individual vs de grup) este mai eficientă?”; (c) „există un efect de interacţiune între aceşti factori care să ne ajute la interpretarea nuanţată a efectului – reducerea nivelului de anxietate socială”  Figura Designuri experimentale de bază (stânga) şi factoriale (dreapta) Aceste designuri factoriale pot fi obţinute nu numai prin încrucişarea a două sau mai multe VI manipulate de către cercetător (de exemplu, tipul de muzică audiată şi durata audiţiei) (completely randomized design), ci şi prin intersectarea unei variabile manipulate experimental (de exemplu, tipul de muzică ascultată) cu o variabilă de tip etichetă, ce descrie diferenţe existente în mod natural între participanţi (cum ar fi sexul participanţilor: bărbaţi vs femei) (blocked randomized design) În sfârşit, manipularea VI se poate face în două feluri majore: prin apelul la un design de tip intergrup (between-subjects design), respectiv prin apelul la un design de tip intragrup, de tipul măsurătorilor repetate (within-subjects design) În cazul designului de tip intergrup fiecare participant trece printr-o singură condiţie experimentală (unii ascultă muzică de Mozart, alţii aşteaptă în linişte etc ), astfel încât fiecare participant este testat o singură dată Situaţia opusă este reprezentată de designul intragrup în care fiecare participant trece prin toate condiţiile experimentale, performanţele sale fiind măsurate în mod repetat De exemplu, dacă ar fi să ne raportăm la designul de bază prezentat în partea stânga a figurii , aceeaşi participanţi vor fi testaţi după fiecare situaţie în care sunt supuşi: ascultând muzică de Mozart, ascultând muzica unui alt compozitor, dar prezentată ca fiind a lui Mozart, respectiv aşteptând în linişte Desigur, în cazul unor designuri de tip factorial (adică a prezenţei a cel puţin două VI), se pot întâlni şi situaţii mixte (design mixt), dacă una dintre variabilele independente este manipulată intergrup, iar cealaltă variabilă independentă este manipulată într-o manieră de tip intragrup Probleme uzuale legate de manipularea VI prin designuri de tip intragrup Dintre tipurile de design amintite mult mai răspândite sunt cele de tip intergrup, în ciuda faptului că necesită un număr mult mai mare de participanţi decât designurile de tip intragrup Acest lucru este cauzat de unele neajunsuri asociate manipulării variabilelor independente într-un design cu măsurători repetate, aspecte descrise în tabelul de mai jos Tabelul Riscuri privitoare la validitatea internă a rezultatelor în experimente cu un design intragrup (adaptare după Pelham şi Blanton, ) Denumire Descrierea problemei Soluţii existente  Reportarea efectului (efectul de ordine) Efectul apare atunci când răspunsul la stimulul anterior influenţează răspunsul la stimulul următor, fără a se dori explicit acest lucru Un exemplu de efect de tip carry-over este cazul în care se solicită participanţilor să aprecieze cât de gravă este încălcarea regulii de a purta centură de siguranţă, după ce în prealabil persoanele au fost chestionate despre gravitatea comiterii unui omor Participanţii incluşi în această situaţie vor aprecia că este mai puţin gravă abaterea de a nu purta centură de siguranţă prin contrast cu gravitatea omorului În schimb, abaterea este considerată a fi mai gravă de către participanţii care ar răspunde mai întâi la întrebarea respectivă şi abia mai apoi la cea legată de infracţiunea de omor Dincolo de efectele de reportare bazate pe efectul de contrast sau de cele bazate pe efectul de similaritate, se poate vorbi despre un efect de reportare în urma exersării (practicării repetate a sarcinii), astfel încât sarcinile aflate la final să fie realizate mai rapid (facil), dacă se aseamănă cu primele Atât pentru reducerea/evitarea efectului de reportare, cât şi pentru evitarea distribuirii într-o manieră inegală a consecinţelor oboselii sau implicării scăzute în sarcină există o soluţie reparatorie, denumită contrabalansare Pentru un număr redus de probe de completat ( - probe) ideal ar fi să se apeleze la contrabalansarea totală, ceea ce înseamnă că ordinea în care se răspunde la probe este diferită de la o persoană la alta, acoperindu-se toate combinaţiile posibile De exemplu, dacă există două probe/sarcini (A şi B), acestea pot fi prezentate randomizat, fie în ordinea AB, fie în ordinea BA În cazul a trei probe (ABC) combinaţiile posibile sunt ABC, ACB, BCA, BAC, CAB şi CBA Dacă numărul de probe este unul mai ridicat, devine imposibil să apelăm la contrabalansarea totală deoarece numărul de combinaţii posibile depăşeşte adesea numărul de participanţi într-un studiu (de exemplu, dacă ar fi să combinăm probe într-o manieră random unică vom avea ! combinaţii posibile, adică de combinaţii unice) În aceste cazuri se apelează la soluţii de contrabalansare parţială, dintre care cea mai cunoscută este pătratul latin (detalii în Pelham şi Blanton, ) În situaţia combinării a patru probe: A, B, C şi D este necesar ca acestea să fie aplicate randomizat în patru succesiuni diferite: ABCD, BADC, CDAB şi DCBA  Oboseala/lipsa de motivare Dacă sarcinile pe care le are de rezolvat o persoană într-un design intragrup solicită un efort îndelungat din partea respondenţilor, este posibil să se instaleze oboseala, fapt ce ar afecta performanţa în sarcinile aflate spre finalul setului de probe de completat De asemenea, în cazul persoanelor cu motivaţie scăzută se poate instala dezinteresul şi poate creşte riscul de completare la întâmplare a probelor aflate spre finalul setului de sarcini primite   Creşterea riscului ca participanţii să intuiască ipotezele studiului Ideal ar fi ca participanţii la un studiu să nu intuiască ce se urmăreşte exact prin studiul respectiv pentru a nu fi afectaţi în răspunsurile lor de aceste presupoziţii (în limba engleză acest caz este cunoscut Desigur, cea mai bună soluţie în acest context ar fi renunţarea la designul intragrup, în favoarea unuia integrup, deoarece este mai puţin probabil ca participanţii să intuiască despre ce era   sub denumirea de demand characteristics) De exemplu, dacă participanţii efectuează exerciţii de relaxare în condiţii de linişte, apoi fac aceste exerciţii în condiţii în care ascultă muzică clasică, pot intui mai uşor că studiul vizează efectul pe care ambientul sonor îl are asupra eficienţei utilizării unor tehnici de relaxare şi pot decide să răspundă într-un mod care să-l mulţumească pe experimentator (considerând că nivelul mai profund de relaxare este atins în contextul în care se ascultă muzică clasică) vorba în experiment, în contextul în care ar fi fost supuşi doar condiţiei de a exersa tehnicile de relaxare în linişte, spre exemplu A doua modalitate de lucru valabilă atât pentru designuri de tip intergrup, cât şi pentru cele de tip intragrup este introducerea unor întrebări directe în partea de debriefing (finalul studiului) în care se solicită participanţilor să intuiască ipoteza studiului/aşteptările cercetătorului, însoţită de decizia de a-i elimina pe aceia care intuiesc ipotezele studiului din cauza riscului crescut ca răspunsurile acestora să fie distorsionate în favoarea conformării ipotezei  În ciuda acestor neajunsuri ale unui design de tip intragrup , acesta are avantajul de a controla toate variabilele străine care ţin de individul examinat, fiind vorba de aceeaşi persoană supusă unor contexte experimentale diferite Acest fapt conduce la o putere statistică superioară de a testa efectele urmărite, în condiţiile unui număr mai redus de participanţi Spre deosebire de acest caz, în designurile experimentale de tip intergrup principala problemă care necesită rezolvare este tocmai controlul variabilelor străine ce ţin de caracteristicile participantului, în lipsa acestui control putând fi afectate concluziile cu privire la relaţia de tip cauză-efect Pentru a rezolva această problemă cea mai potrivită soluţie este decizia de a distribui participanţii în grupele experimentale într-o manieră aleatorie (randomizată) pentru a egaliza (controla) astfel potenţialul efect distorsionant pe care variabilele confundate l-ar putea juca asupra relaţiei cauzale studiate Înainte de a explicita în detaliu ce presupune distribuirea randomizată a participanţilor în grupele experimentale, se cuvine să precizăm o ultimă problemă ce poate afecta interpretarea rezultatelor obţinute în urma manipulării experimentale a VI, şi anume problematica variabilelor confundate Problema variabilelor confundate în cazul manipulării VI Variabilele confundate (confounding variables, nuisance variables sau hidden variables) mai sunt cunoscute şi sub titulatura de variabile ascunse sau variabile străine, fiind vorba de acele variabile pe care cercetătorul nu le controlează într-un mod explicit, dar care pot afecta validitatea internă a unui studiu De aceea se impun măsuri de control experimental sau statistic al efectului acestora Detalii suplimentare despre acest tip de variabile sunt oferite în caseta din capitolul următor Cele mai clare cazuri de variabile confundate pot fi evidenţiate în cazul studiilor de tip non-experimental De exemplu, Pelham şi Blanton ( ) evidenţiază complexitatea fiinţei umane, fapt ce favorizează existenţa unor variabile confundate De pildă, în urma unui studiu longitudinal ar putea reieşi următorul rezultat statistic corect: există o mortalitate mai crescută la indivizii care s-au tatuat decât în rândul celor care nu au niciun tatuaj Mai mult, riscul de a deceda, în intervalul de zece ani avut sub observaţie, este cu atât mai ridicat cu cât indivizii posedă mai multe tatuaje Desigur, o asemenea concluzie ar fi cauzată de existenţa unor variabile străine necontrolate (variabile confundate), pentru că este puţin probabil să poată fi controlate toate variabilele posibile, responsabile pentru un asemenea rezultat De exemplu, o serie de factori ce cresc mortalitatea sunt asociaţi mai frecvent persoanelor care se tatuează Astfel, persoanele care au mai multe tatuaje tind să adopte un stil de viaţă bazat pe: (a) un consum mai ridicat de tutun şi alcool; (b) o dietă cu multe grăsimi şi consum redus de fibre; (c) complianţă scăzută la tratamentele necesare în cazul unor condiţii cronice precum hipertensiune arterială sau diabet; (e) un stil mai agresiv (mai puţin precaut) de conducere a autovehiculului; (f) o preferinţă pentru motociclete, ca mijloc de locomoţie; (g) nesocotirea unor norme şi reguli sociale etc Desigur, dacă am fi controlat toţi aceşti factori posibili, asocierea dintre tatuare şi vârsta decesului ar fi devenit, probabil, nesemnificativă statistic, însă este greu de crezut că este fezabil să controlăm toate variabilele confundate posibile Pe scurt, variabilele confundate sunt cele la care cercetătorul, fie nu s-a gândit, fie nu le-a putut controla, dar care prin natura lor (variază sistematic cu variabilele supuse asocierii – în cazul studiilor non-experimentale, respectiv cu VI şi VD – în cazul studiilor experimentale) Ele pot reprezenta sursa reală pentru efectul (relaţia) observat, afectând astfel validitatea unui studiu  Figura Surse ale distorsiunilor determinate de variabile confundate Variabile confundate având drept sursă caracteristicile participanţilor În studiile experimentale, aceste situaţii de variabile confundate legate de caracteristicile participanţilor sunt controlabile În designurile de tip intergrup se apelează la distribuirea randomizată a subiecţilor în grupele experimentale – procedeu menit să conducă la constituirea unor grupe echivalente (similare) din perspectiva variabilelor potenţial confundate –, această metodă nu este una infailibilă, situaţie în care discutăm despre un bias (distorsiune) de selecţie În cazul designului intragrup, variabilele confundate ce ţin de caracteristicile participanţilor sunt controlate integral prin aplicarea procedurilor pe aceiaşi subiecţi Secţiunea prezintă pe larg procedura cea mai des întâlnită, aceea a alocării randomizate a participanţilor în grupele experimentale Variabile confundate având drept sursă metodele sau procedurile utilizate Nu doar participanţii pot ascunde variabile confundate în sine, ci şi procedurile experimentale utilizate în manipularea VI (diferite modalităţi ale presupusei variabile-cauză) Să presupunem că un individ este interesat să urmărească dacă persoanele anxioase reţin mai bine cuvinte cu valenţă negativă (de exemplu, bolnăvicios), decât cuvinte cu valenţă pozitivă (de exemplu, echitabil) Din nefericire, aceste cuvinte nu diferă numai prin valenţa lor afectivă, ci şi prin nivelul de familiaritate (mai utilizat fiind bolnăvicios), prin nivelul de activare (arousal) – mai „viu” fiind tot cuvântul bolnăvicios etc Dacă nu sunt controlate aspecte, precum gradul de familiaritate, lungimea cuvintelor, nivelul lor de expresivitate (intensitate), ar fi dificil să afirmăm că diferenţele observate în performanţa mnezică ar fi determinate de valenţa afectivă a cuvintelor, deoarece există şi alte dimensiuni prin care acestea diferă Acelaşi lucru poate fi avut în vedere inclusiv în situaţii experimentale complexe De pildă, atunci când se compară două forme de psihoterapie din perspectiva nivelului lor de eficienţă este important ca ambele forme să fie implementate de către un personal calificat, ca ambele să aibă niveluri procentuale similare de participanţi care renunţă la psihoterapie înainte de termenul convenit etc Pentru eliminarea efectului unor variabile străine (variabile pe care cercetătorul le-a luat în considerare ca potenţiali factori ce afectează relaţia cauză-efect) soluţiile de corectare sunt controlul statistic (măsurarea variabilelor respective şi eliminarea efectului acestora prin tehnici statistice de tipul ANCOVA, corelaţii parţiale sau regresii ierarhice), respectiv controlul metodologic (de exemplu, dacă genul persoanei ar constitui o variabilă confundată se pot efectua studii doar pe femei sau pot fi formate grupele experimentale în proporţii egale pe sexe etc ) De asemenea, pentru eliminarea efectului unor variabile străine neluate în calcul sau necontrolate iniţial şi pentru decelarea impactului acestora la nivelul variabilei dependente, corectarea se poate face şi prin replicarea rezultatelor obţinute în contexte experimentale similare, dar nu identice, precum este exemplul descris în caseta Caseta Descrierea unui caz de variabilă confundată întâlnit în studiile experimentale derulate în scop explicativ (adaptare după Pelham şi Blanton, ) Dispoziţiile afective pozitive ne determină să fim mai altruişti? Pentru a răspunde la această întrebare ce vizează identificarea unei relaţii de tip cauză-efect între dispoziţia afectivă şi comportamentul altruist, primele cercetări experimentale realizate într-un mod riguros au distribuit randomizat participanţii, fie în grupa celor care primeau un feedback pozitiv pentru activitatea depusă pentru a intensifica dispoziţia afectivă pozitivă a acestor persoane, fie în grupa celor care nu primeau un asemenea feedback Datele obţinute din astfel de studii susţin ipoteza avută: cei care au primit un feedback pozitiv au relatat o dispoziţie afectivă pozitivă mai intensă decât grupul de control şi, ce este mai important, au fost mai altruişti în comportamentul lor (de exemplu, au acordat mai mulţi bani unor complici care „cerşeau” la ieşirea din locaţia experimentală) Problema cu această manipulare experimentală este faptul că a acorda un feedback pozitiv unui interlocutor are ca efect nu numai inducerea unei dispoziţii afective pozitive, ci şi modificarea credinţei acestuia în competenţa sa de a face faţă provocărilor Or, persoanele care se simt mai competente într-un domeniu sunt, de asemenea, mai predispuse să-i ajute pe cei care le solicită ajutorul, fiind astfel mai altruiste (Isen şi Levin, apud Pelham şi Blanton, ) De aceea, nu este clar dacă altruismul mai ridicat este o consecinţă a unei dispoziţii afective pozitive sau unei augmentări a încrederii celor chestionaţi în competenţa lor de a se descurca în sarcini Pentru a rezolva această dilemă, alţi cercetători au propus o manipulare diferită a dispoziţiei afective care să nu conducă şi la modificarea credinţei participanţilor în competenţa lor În acest sens, celor din grupul experimental li s-au oferit prăjiturele în timp ce rezolvau sarcina, pentru a observa dacă acest surplus indus de buna-dispoziţie conduce la augmentarea comportamentului altruist Datele obţinute sprijină ipoteza că dispoziţia afectivă pozitivă (mai ridicată în grupul celor care au primit prăjituri) a condus la niveluri mai ridicate ale comportamentului altruist Chiar dacă acest context experimental nu mai este unul care să conducă la modificări în competenţa autopercepută a respondenţilor, este posibil ca rezultatul obţinut să fie distorsionat de un alt aspect Astfel, cei din grupul experimental au fost expuşi unui model de comportament prosocial (primind prăjituri din partea unor străini), în condiţiile în care expunerea la comportamente prosociale este o altă cauză a apariţiei unei conduite de tip altruist În sfârşit, pentru a rezolva şi această posibilă situaţie de variabile confundate, o altă manipulare propusă pentru inducerea unei dispoziţii afective pozitive a fost aceea de a manipula contextul experimental astfel încât cei din condiţia experimentală să găsească o monedă pierdută (nerevendicată) spre deosebire de cei din grupul de control care nu au avut un asemenea „noroc” Şi în acest caz, rezultatele au indicat că persoanele din grupa cu o dispoziţie afectivă pozitivă mai ridicată (norocoşii) au manifestat un comportament prosocial mai intens decât cei din grupa de control Acest design are însă meritul de a nu conduce nici la modificări în competenţa autopercepută a candidaţilor, nici la situaţii de expunere la un model prosocial Prin urmare, atât prin replicarea rezultatelor în contexte experimentale diferite, cât mai ales prin identificarea unui design de cercetare care să elimine posibile explicaţii alternative (variabile confundate), există un sprijin consistent pentru a afirma că o dispoziţie afectivă pozitivă creşte comportamentul de tip altruist Desigur, pe lângă soluţia principală de a manipula experimental VI de interes astfel încât aceasta să înceteze a mai fi afectată de o potenţială variabilă confundată, există întotdeauna posibilitatea replicării unui studiu, cu includerea unei măsurători pentru variabila confundată analizată De exemplu, în contextul repetării unui studiu experimental bazat pe inducerea unei dispoziţii afective pozitive ca urmare a unui feedback pozitiv, se poate include suplimentar drept covariabilă măsurarea competenţei autopercepute prin intermediul unei scale validate din punct de vedere psihometric, astfel încât analizele statistice efectuate să evidenţieze eventualele diferenţe dintre grupul experimental şi cel de control, în contextul în care este controlat statistic nivelul competenţei autopercepute (în situaţia ipotetică în care toţi respondenţii ar avea acelaşi nivel al competenţei autopercepute) Variabile confundate având drept sursă implementarea distorsionată a studiului În această categorie sunt incluse toate acele cauze potenţiale care vizează direct modul în care este implementat un anumit studiu De exemplu, în cazul unui experiment pot apărea distorsiuni cauzate de: (a) lipsa de standardizare a instructajului oferit participanţilor la studiu (variaţii în lungimea şi nivelul conversaţiilor cu participanţii premergătoare studiului, instructaj scurtat în cazul unor participanţi care par a prinde repede ce au de făcut etc ); (b) distorsiuni cauzate de caracteristicile şi aşteptările cercetătorului/asistentului de cercetare (caracteristici demografice şi stil de lucru diferit al asistenţilor de cercetare; comportament diferenţiat faţă de participanţi în funcţie de condiţia lor experimentală – cum ar fi niveluri diferite de entuziasm şi de atenţie acordată participanţilor); (c) distorsiuni legate de caracteristicile sarcinii experimentale (demand characteristics) (dacă sarcinile sunt prea transparente, participanţii vor intui ipotezele cercetării şi se vor comporta predominant într-un mod care să mulţumească experimentatorul/confirme aşteptările acestuia privind cel mai potrivit mod de a răspunde sau a se comporta) Pentru a elimina asemenea posibile distorsiuni , pot fi implementate o serie de măsuri precum: (a) standardizarea procedurilor de testare (instructaj oferit de către calculator, utilizarea unor „falşi subiecţi” pentru a verifica gradul de respectare a instrucţiunilor de examinare); (b) utilizarea unui design de cercetare de tip orb (în care participanţii să nu cunoască exact condiţia în care au fost distribuiţi – grupuri placebo – sau în care cei care efectuează evaluările nu cunosc cărui grup aparţin participanţii testaţi) sau dublu orb (în care atât participanţii, cât şi asistenţii de cercetare, cel puţin cei care efectuează măsurătorile de interes, nu cunosc cărui grup experimental aparţin indivizii testaţi); (c) utilizarea unui interviu sau a unui chestionar la finalul cercetării (debriefing) pentru a detecta cazurile potenţiale de a fi afectate de caracteristicile sarcinii (indivizii care au intuit corect ipoteza vizată de cercetare şi relaţia dintre sarcinile primite spre rezolvare şi ipoteza studiului) Problema artefactelor în cazul manipulării VI Spre deosebire de variabilele confundate care variază atât cu VI, cât şi cu VD, artefactele reprezintă o serie de distorsiuni constante în cadrul studiului experimental Prin efectul lor constant, ele nu afectează validitatea internă a unui studiu, ci pe cea externă, deoarece rezultatul obţinut între VI şi VD este valabil numai în contextul în care artefactul respectiv este prezent În categoria artefactelor intră de obicei acele variabile pe care cercetătorul nu este interesat să le studieze, dar care prin efectul lor afectează validitatea externă a concluziilor unui studiu Un exemplu de artefact este reactivitatea participanţilor într-un studiu experimental de laborator Aceştia pot adopta, pentru că sunt observaţi un anumit comportament care să nu fie replicabil în contexte sociale ecologice Faptul că majoritatea studiilor experimentale se derulează în condiţii de laborator pentru a controla diferite variabile străine, nu face altceva decât să replice efectul artefactului în contexte în care participantul realizează faptul că este monitorizat comportamentul său Creşterea realismului situaţiei experimentale poate contribui la diminuarea efectului pe care artefactul reactivităţii participanţilor îl joacă în dinamica dintre VI şi VD Un alt exemplu de artefact este mediul cultural (de exemplu, unele efecte pot fi replicate doar în societăţi individualiste, orientate spre competiţie, dar nu şi în medii culturale estice, cum este asocierea dintre percepţia unicităţii – „sunt o persoană specială” şi stima de sine) Dacă în societăţile individualiste există o asociere pozitivă între percepţia unicităţii şi stima de sine, în cele colectiviste această relaţie este una negativă Iată un alt exemplu: un consilier creştin este interesat să studieze rolul benefic al religiei şi orientării către spiritualitate la bolnavii de cancer; acest rol pozitiv a fost replicat şi în alte studii efectuate pe credincioşi Statutul de persoană credincioasă poate reprezenta în aceste cazuri un artefact Pentru a controla influenţa acestui factor, ar fi interesant să vedem dacă religia şi practicile spirituale sunt mecanisme benefice de coping la bolnavii de cancer care se declară atei În sfârşit, artefacte pot rezulta şi din favorizarea (standardizarea) unor anumite proceduri de lucru în studiile experimentale De exemplu, în cazul condiţionării afective (transmiterea valenţei afective de la un stimul necondiţionat spre un stimul condiţionat, cu valenţă iniţială neutră), se pare că unul dintre cele mai importante mecanisme pentru apariţia efectului este conştientizarea asocierii dintre stimulul necondiţionat şi cel condiţionat Însă această concluzie are o valabilitate limitată de vreme ce peste % dintre studiile din această zonă utilizează doar măsuri explicite pentru a aprecia preferinţa pentru stimulul condiţionat (Hoffman et al , ) Dacă s-ar lua în calcul măsuri implicite ale preferinţei pentru stimulul condiţionat mecanismul pentru apariţia schimbării ar putea fi unul diferit de cel al conştientizării asocierii dintre stimuli Spre deosebire de cazul variabilelor confundate, artefactele sunt mult mai dificil de identificat şi de corectat Pentru a evita situaţia în care relaţia dintre VI şi VD există doar în contextul existenţei unor artefacte, ideal ar fi să se replice rezultatele prin varierea situaţiilor experimentale pe diferite dimensiuni relevante, pentru a creşte validitatea externă a concluziilor şi, îndeosebi, validitatea ecologică a rezultatelor obţinute Caseta Studiu de caz Pornind de la datele existente în literatura de specialitate, terapia prin muzică poate fi o metodă eficientă de reducere a anxietăţii şi, în general, de reducere a stresului, atât la adulţi, cât şi la copii (Bradt şi Dileo, ; Klassen, Liang, Tjosvold, Klassen şi Hartling, etc ) Tipul de muzică pare a fi un factor important, cele mai bune rezultate din studiile făcute pe populaţie americană fiind obţinute pe muzică clasică, muzică din genul New Age şi latino-jazz, iar cele mai puţin eficiente fiind obţinute pe muzică rock (apud Pfister, Jones şi Cheek, ) O cercetare efectuată în România pe această temă (Gherman, ) a urmărit să replice efectul pozitiv al muzicii asupra reducerii anxietăţii pe un lot de pacienţi cardiaci supuşi unei intervenţii invazive (stentare carotidiană) Au fost avute în vedere trei tipuri de muzică, audiate cu acordul participanţilor la căşti, în timpul derulării procedurii de stentare: fie muzică clasică, fie muzică latino-jazz, fie folclor (muzică populară) Rezultatele studiului experimental au arătat că nivelul cel mai scăzut de anxietate a fost obţinut în condiţia de ascultare a muzicii populare, în timp ce s-a înregistrat chiar o creştere a nivelului de anxietate postoperatorii faţă de pretest, în grupul celor care au ascultat muzică latino-jazz, respectiv clasică Ce cauze (explicaţii) sunt posibile pentru divergenţa rezultatelor, pornind de la premisa că toate studiile au avut un nivel calitativ superior (randomizare, fără alte artefacte induse de experimentator)? Probleme privind validitatea de construct a studiului Divergenţa este cauzată de prezenţa unor variabile confundate în modul de manipulare a VI: familiaritatea cu genul muzical; preferinţa pentru un anumit gen muzical Este posibil ca responsabilitatea pentru scăderea nivelului de anxietate să nu aparţină caracteristicilor melodice (tonalitate, ritm), ci gradului de familiarizare a persoanei cu genul muzical respectiv şi/sau preferinţele sale muzicale Intervenţia la care sunt supuşi participanţii este una invazivă, prin urmare inductoare a unui cadru anxiogen Apelul la stimuli familiari sau plăcuţi pare a fi chiar o modalitate rezonabilă de coping în asemenea situaţii Dacă această explicaţie este adevărată, atunci este afectată validitatea internă a studiilor anterioare, iar concluzia că muzica clasică sau cea latino-jazz sunt cele mai eficiente în reducerea anxietăţii şi stresului ar fi hazardată În acest context ar fi nevoie de studii suplimentare cu scopul de a stabili relaţia dintre familiaritate, preferinţă sau tipul de muzică ca elemente active pentru reducerea anxietăţii/stresului Probleme privind validitatea externă a studiului Divergenţa este cauzată de prezenţa a două posibile artefacte în studiile anterioare: (a) mediul cultural relativ omogen (peste % din studiile anterioare sunt realizate în SUA, pe loturi preponderent formate din studenţi); (b) momentul introducerii calupului muzical Astfel, eşantionul din România diferă semnificativ faţă de cel utilizat în studiile anterioare, atât din perspectiva gusturilor muzicale, cât şi din perspectiva nivelului de studii, deoarece participanţii incluşi în studiul din România aparţin într-o proporţie de peste % celor care au cel mult clase de şcoală, un grup-ţintă care, foarte probabil, este familiarizat şi îndrăgeşte muzica populară, dar în acelaşi timp manifestă reticenţă faţă de stilul muzicii clasice sau latino-jazz În privinţa momentului introducerii muzicii, există alte diferenţe între studiul realizat în România şi majoritatea celor realizate anterior În studiile anterioare, participanţii ascultau muzică într-un context preoperator (sala de pregătire pentru intervenţie), în timp ce în studiul efectuat în România participanţii ascultau muzica la căşti în timpul intervenţiei de stentare carotidiană) Dacă aceste explicaţii sunt adevărate, atunci validitatea internă a studiilor rămâne una corectă (muzica clasică şi cea latino-jazz pot fi eficiente în reducerea anxietăţii), dar dobândesc o valabilitate limitată (de exemplu, în mediul cultural american/în cazul persoanelor cu studii superioare etc ), fiind în acest fel afectată validitatea externă, adică gradul de generalizare a rezultatelor În sfârşit, divergenţa dintre rezultate poate avea drept sursă combinaţia elementelor menţionate anterior, situaţie în care ar fi afectată, atât validitatea de construct, cât şi cea externă Desigur, fiind vorba de un singur studiu cu rezultate contrare, ar fi nevoie de replicarea acestor rezultate, preferabil de către echipe de cercetători diferiţi, pentru ca dovezile de combatere a concluziilor iniţiale să fie considerate unele solide Dacă asemenea studii ar replica rezultatele obţinute în studiul din România, s-ar ajunge la revizuirea asumpţiei că numai anumite tipuri de muzică sunt eficiente în combaterea anxietăţii Controlul variabilelor străine prin randomizare Atunci când se compară performanţele grupului experimental cu cele ale grupului de control, este important ca acest lucru să se realizeze în condiţiile în care riscul existenţei unei distorsiuni (bias) de selecţie a participanţilor să fie minim De asemenea, este important ca riscul apariţiei unor modificări temporale în mod diferenţiat între grupe să fie minim Avem nevoie de acest lucru pentru a ne putea încrede că eventualele diferenţe observate sunt determinate de manipularea variabilei independente (cauza acceptată a diferenţelor existente între grupe) şi nu de existenţa unor diferenţe observate în cazul altor variabile străine (diferenţe existente între grupul experimental şi cel de control) O modalitate de a exercita controlul asupra variabilelor străine, cunoscută sub denumirea de control statistic al variabilelor, se face prin intermediul unor tehnici statistice cum ar fi regresia multiliniară ierarhică sau analiza de covarianţă (ANCOVA) Cu ajutorul acestor tehnici se poate elimina efectul variabilelor străine luate în calcul asupra relaţiei cauzale de interes Problema cu acest tip de control al variabilelor străine este aceea că nu pot fi avute în vedere toate variabilele posibile care pot afecta relaţia de tip cauză-efect studiată De exemplu, într-un studiu care compară eficienţa unei anumite metode alternative de predare a matematicii comparativ cu metoda uzuală de predare din perspectiva rezultatelor obţinute la bacalaureat la disciplina matematică pot exista o multitudine de diferenţe posibile între elevi cum ar fi: (a) niveluri diferite de cunoştinţe despre matematică între grupul experimental şi cel de control; (b) niveluri diferite ale abilităţilor cognitive generale (de inteligenţă) ce afectează ritmul învăţării şi retenţia cunoştinţelor noi; (c) niveluri diferite de motivaţie pentru performanţă şcolară; (d) niveluri diferite de expertiză din partea profesorilor care predau cele două metode comparate; (e) niveluri diferite ale climatului şcolar; (f) politici diferite cu privire la absenteismul şcolar; (g) niveluri diferite de statut socioeconomic ale părinţilor Deşi pot fi controlate statistic multe asemenea variabile importante pentru a elimina efectul acestora asupra relaţiei dintre variabila independentă (metoda de predare) şi cea dependentă (performanţa la bacalaureat), este improbabil că vor putea fi controlate statistic toate variabilele care au impact asupra relaţiei dintre VI şi VD Soluţia optimă pentru a controla efectul potenţial al tuturor variabilelor relevante asupra relaţiei dintre VI şi VD nu este aceea a controlului statistic (măsurarea tuturor acestor variabile), ci a controlului exercitat prin design, adică prin alocarea randomizată a subiecţilor în grupele experimentale Acest lucru presupune faptul că indivizii incluşi în studiu nu sunt comparaţi în cadrul grupurilor naturale din care fac parte (de exemplu, copii de la grădiniţe de stat vs copii de la grădiniţe particulare) şi nici măcar nu au posibilitatea de a-şi alege ei grupul din care să facă parte În schimb, indivizii incluşi în studii experimentale consimt informat să lase în responsabilitatea cercetătorului sarcina de a-i distribui aleatoriu (ca într-o loterie) într-unul din grupele experimentale, chiar fără a li se comunica decât la finalul studiului natura reală a grupului din care au făcut parte Principala problemă pe care o rezolvă alocarea randomizată a participanţilor în grupele experimentale este eliminarea distorsiunii de selecţie a participanţilor, cu condiţia ca grupurile formate să fie suficient de mari (de exemplu, peste de persoane în fiecare grup experimental) Pentru a înţelege importanţa acestui aspect, vom apela la un exemplu din ştiinţele medicale În mod obişnuit se recunoaşte impactul pozitiv al consumului de suplimente alimentare precum vitamina C sau vitamina E ca factori protectivi pentru imunitate etc Aceste concluzii se bazează însă pe studiul unor grupuri natural constituite (fără alocare randomizată), bazată pe compararea celor care consumă asemenea suplimente alimentare în mod voluntar cu cei care nu apelează la aceste suplimente Asemenea rezultate eşuează însă în a ţine seama de alte diferenţe existente între cele două grupe comparate (de exemplu, cei care folosesc asemenea aditivi tind să apeleze de asemenea la o dietă alimentară mai corectă, să fie mai puţin predispuşi la consumul de alcool şi tutun etc ) Prin alocarea randomizată a participanţilor într-un asemenea studiu se apelează la o populaţie selecţionată (de exemplu, persoane care nu consumă alcool decât ocazional, care nu fumează, nu au un istoric al unor boli cronice, nu consumă aditivi alimentari) pe care apoi îi împarte aleatoriu în două grupe: unii care vor consuma regulat vitamina C şi cei care cred că vor consuma regulat vitamina C (primind pastile placebo) Dacă în aceste condiţii stricte de control există diferenţe între cei care consumă vitamina C şi cei care nu consumă vitamina C, am putea spune că vitamina C are un efect benefic asupra sănătăţii din perspectiva reducerii riscului morbidităţii Surprinzător, poate, rezultatele obţinute în asemenea condiţii de control nu confirmă credinţele populare Astfel, o metaanaliză de studii experimentale realizată de Bjelakovic et al ( ) a arătat că cei care consumă antioxidanţi precum vitaminele A, E sau betacaroten prezintă un risc crescut de mortalitate comparativ cu cei din grupurile de control – tip placebo), iar în cazul celor care consumă suplimente precum selenium sau vitamina C nu există diferenţe semnificative statistic cu privire la riscul mortalităţii între grupul experimental şi cel de control Aşadar, comparaţiile între grupul experimental şi cel de control au sens în a fi interpretate corect doar în absenţa unei distorsiuni în selecţia participanţilor, iar acest lucru poate fi realizat, fie prin apelul la un design intragrup (acolo unde este posibil), fie prin alocarea randomizată a participanţilor în grupele experimentale, în cazul unor designuri de tip intergrup Merită menţionată aici distincţia conceptuală importantă dintre selecţia aleatorie a unui eşantion de persoane din populaţia de interes (random selection) şi alocarea randomizată a subiecţilor în grupe de studiu (random assignment) Primul caz are în vedere ceea ce se întâmplă adesea în sondajele de opinie (chestionarea unui număr de de persoane dintr-o comună cu un total de de locuitori prin selectarea aleatorie a persoanelor chestionate – aspect ce potenţează validitatea externă a unui studiu) Cel de-al doilea caz nu-şi propune să selecteze aleatoriu eşantionul chestionat, acesta putând fi unul de convenienţă (cum ar fi dintre locuitorii satului prezenţi la o întâlnire organizată de primărie), ci îşi propune să îi distribuie aleatoriu pe participanţi în grupele experimentale pentru a-i chestiona în două situaţii diferite: unii fiind rugaţi să aprecieze activitatea primăriei, în regim de anonimat, iar alţii, în contextul în care li se solicită să-şi dezvăluie identitatea înainte de a-şi exprima opiniile Alocarea randomizată a participanţilor în grupele de studiu este o condiţie esenţială în designurile intergrup pentru a asigura un nivel ridicat al validităţii interne a cercetării Sugestii practice pentru alocarea randomizată a participanţilor A aloca randomizat participanţii în grupele experimentale înseamnă a acorda şanse egale tuturor participanţilor de a fi incluşi în oricare dintre condiţiile experimentale ale studiului Într-o variantă minimală, acest lucru presupune apelul la unele metode clasice precum randomizarea sistematică (de exemplu, într-un design cu trei grupe se utilizează un pas de trei, astfel încât indivizii cu numărul de ordine [înscriere] , , , etc sunt distribuiţi în primul grup, cei cu numerele , , , etc sunt distribuiţi în cel de-al doilea grup, iar indivizii cu numerele , , , etc sunt incluşi în cel de-al treilea grup experimental) Alte variante rudimentare de alocare randomizată a indivizilor presupun utilizarea unor criterii neutre de selecţie (cei născuţi în luni pare vs impare; cei care au iniţiala numelui de familie de la A la I vs de la J la Z; ultima cifră pară sau impară din CNP-ul participantului etc ) Într-o lume ideală, asemenea procedee ar fi considerate adecvate pentru o alocare randomizată de calitate Din nefericire, însă, aceste criterii pot conduce la conduite conştiente sau inconştiente soldate cu o distorsiune de selecţie De exemplu, în mod conştient, unui participant îi poate fi rezervat un număr care să-l distribuie într-o anumită grupă (de exemplu, dacă la interviul iniţial participantul pare a fi un individ recalcitrant şi rezistent la sugestii, poate ajunge să fie inclus în grupul de control, deoarece se anticipă că nu vor fi sesizate modificări mari între test şi retest) De asemenea, în cazul în care se cunoaşte deja grupul în care va fi distribuit un anumit participant (pentru că iniţiala numelui său de familie începe cu litera V) acest lucru poate influenţa evaluarea iniţială a îndeplinirii/neîndeplinirii criteriilor de eligibilitate de a fi inclus în studiu, mai ales în contextul în care criteriile de eligibilitate sunt vagi De pildă, individul poate fi considerat drept eligibil dacă urmează a fi distribuit în grupul în care se estimează că ar avea şanse să „ajute” la susţinerea ipotezei de lucru, respectiv să rămână neselectat (declarat neeligibil) dacă se anticipă faptul că nu este potrivit intervenţiei alocate (Torgerson şi Torgerson, ) De aceea, o variantă optimizată a procesului de alocare randomizată a participanţilor în grupele experimentale are în vedere ascunderea procesului de randomizare, astfel încât aceasta să aibă loc fără a se cunoaşte a priori în ce grupă urmează să fie inclusă o anumită persoană testată Tabelul sintetizează principalele recomandări aplicative privind practica alocării randomizate în grupe experimentale la un nivel calitativ superior Cititorii interesaţi de o detaliere a acestor aspecte, precum şi de alte variante adecvate de alocare randomizată pot găsi mai multe informaţii în Torgerson şi Torgerson ( ) Tabelul Soluţii optime de alocare randomizată a participanţilor în grupele experimentale Denumire Descriere, avantaje şi dezavantaje  Randomizare simplă Este cea mai întâlnită formă de randomizare, uşor implementabilă prin apelul la soluţii software de generare a unor numere într-o manieră aleatorie, însoţită de decizia de a aloca participanţii în funcţie de anumite criterii (cei cărora li s-a alocat un număr par – în grupul experimental; cei cărora li s-a alocat un număr impar – în grupul de control) Avantajul acestei soluţii este că cel care face programările pentru evaluare sau evaluările (de eligibilitate) nu ştie în avans din ce grupă va face parte individul Mai mult, dacă distribuirea se face de către un alt coleg, neimplicat în derularea experimentului, nu se va cunoaşte alocarea individului nici după finalizarea părţii de screening iniţial Dezavantajul soluţiei este acela că poate conduce la grupuri inegale de subiecţi şi că, îndeosebi pentru un număr redus de participanţi/grupă, poate fi mai puţin eficientă în a controla variabilele străine De asemenea, pentru studiile care necesită includerea unor participanţi aparţinând unui grup-ţintă greu de găsit (de exemplu, persoane care au trecut prin stadiul de moarte clinică), ar fi nevoie de un interval mai lung de timp pentru constituirea grupelor, fapt ce conduce la creşterea riscului ca în anumite perioade să fie selectaţi numai participanţi pentru un anumit grup (dacă calculatorul generează - numere consecutive indicative pentru acelaşi grup experimental)  Randomizarea restricţionată în perechi (pairwise randomization) Se caută numărul minim de participanţi (de exemplu, două persoane în cazul a două grupe, trei persoane în cazul a trei grupe) care sunt eligibili pentru a participa la studiu Când acest număr minimal este atins, se apelează la numere generate aleatoriu de către un program de calculator pentru a-i distribui în grupele aferente Soluţia rezolvă problemele randomizării simple legate de inegalitatea numărului de subiecţi din grupe sau de secvenţialitatea/temporalitatea intervenţiei Dezavantajul soluţiei constă în temporizarea aplicării intervenţiei (de exemplu, un participant eligibil trebui să aştepte până este identificată o altă persoană eligibilă în cazul existenţei a două grupe experimentale) În plus, soluţia are aceleaşi probleme precum randomizarea simplă, şi anume, riscul de a nu controla eficient toate variabilele străine în cazul unui număr redus de subiecţi per grup experimental  Randomizarea restricţionată stratificată grupată Înainte de randomizare, participanţii sunt împărţiţi după una sau două variabile străine considerate a fi esenţiale De exemplu, într-un studiu care vizează eficienţa persuasivă a două tipuri de mesaje: cu accent pe aspecte cognitive (A) vs cu accent pe aspecte afective (B), randomizarea subiecţilor în grupele experimentale se face după ce în prealabil a fost măsurată complexitatea cognitivă a participanţilor, măsură care a condus la împărţirea prealabilă a participanţilor în indivizi cu complexitate cognitivă ridicată vs scăzută Fiecare dintre cele două categorii a fost supusă apoi procesului de randomizare în grupe de câte patru persoane, astfel încât dacă grupului de patru persoane din categoria celor cu complexitate cognitivă ridicată le revin mesajele persuasive A, B, B, A, celuilalt grup de patru persoane din categoria celor cu complexitate cognitivă scăzută le revin mesajele B, A, A şi B Calupul de patru litere (valabil pentru un design cu două modalităţi ale variabilei manipulate) îşi schimbă ordinea în mod aleatoriu (posibile fiind şase combinaţii: ABAB, AABB, BABA, BBAA, ABBA şi BAAB) Avantajul acestei soluţii este acela că permite controlul unor variabile străine importante inclusiv pentru un număr redus de subiecţi per celulă experimentală/grup şi că păstrează un echilibru numeric între grupele experimentale Dezavantajele soluţiei constau în dificultatea de a controla mai mult decât o singură variabilă străină importantă (din motive de complexitate a designului) şi în faptul că ultima persoană din calupul de patru persoane este predictibilă din perspectiva apartenenţei sale la unul dintre cele două grupuri)  Randomizare adaptivă (minimizare) Minimizarea nu este decât parţial o metodă de alocare randomizată a participanţilor în grupele experimentale, deoarece ea presupune alocarea iniţială (random) a jumătate dintre participanţii eligibili pentru studiu De exemplu, dacă randomizarea are loc la nivel de şcoli, din cele opt şcoli contactate doar patru vor fi randomizate simplu în una din cele două grupe experimentale; celelalte patru şcoli vor fi alocate pe bază raţională astfel încât să obţinem profiluri similare de comparat; de exemplu, dacă o şcoală din centrul oraşului, cu rată de promovabilitate ridicată la examenul de bacalaureat a fost distribuită iniţial prin randomizare în condiţia experimentală A, cealaltă şcoală localizată central şi având o rată de promovabilitate ridicată la bacalaureat, rămasă nedistribuită, va fi distribuită în condiţia experimentală B) Pentru a reduce riscul de distorsiune în selecţie pentru şcolile rămase de distribuit după încheierea procesului de randomizare simplă, este preferabil ca algoritmii de potrivire să fie transpuşi într-un software pe calculator şi să se utilizeze o regulă bazată pe probabilităţi De exemplu, şcoala potrivită pentru o anumită condiţie experimentală poate fi selectată de către calculator, în baza unei probabilităţi de %, nu a uneia de % În asemenea condiţii, minimizarea poate fi văzută ca o metodă de randomizare adaptivă  Pe scurt, randomizarea simplă şi randomizarea în perechi constituie cele mai bune soluţii de randomizare individuală a indivizilor atunci când avem un număr destul de ridicat de participanţi în fiecare condiţie experimentală, iar designul cercetării nu specifică vreun control special acordat unor variabile străine În schimb, minimizarea este soluţia mai potrivită atunci când avem de a face cu un studiu efectuat pe un număr scăzut de persoane sau când randomizarea se aplică la nivel de clustere, în condiţiile în care găsirea de persoane eligibile pentru a participa la studiu necesită destul de mult timp În sfârşit, pentru designurile factoriale parţial randomizate (randomized blocked), în care unele dintre VI sunt variabile etichetă, precum şi pentru cazurile în care se doreşte în mod explicit controlul unor variabile străine, iar numărul de participanţi la studiu este unul moderat, soluţia potrivită este aceea de a utiliza randomizarea stratificată, într-o variantă simplă sau grupată  Figura Soluţii optime de alocare randomizată în funcţie de contextul cercetării Indiferent de modalitatea de randomizare aleasă, o randomizare de calitate ar trebui să includă metode de ascundere a rezultatului alocării în condiţiile experimentale (allocation concealment) Soluţia pentru a atinge acest deziderat vizează delegarea responsabilităţii randomizării La ora actuală s-au dezvoltat servicii contra cost de randomizare a participanţilor în studiu (Torgerson şi Torgerson, ), însă este acceptabil şi să rugăm un coleg neimplicat în studiu să apeleze la generarea (extragerea) grupei din care face parte un participant declarat a fi eligibil, după ce a semnat, în prealabil, formularul de participare consimţită la studiu De asemenea este importantă mascarea cunoaşterii grupului în care a fost distribuită o anumită persoană de către cei care fac măsurătorile evoluţiei participanţilor la studiu în timp (pretest, interim, posttest, urmărire [follow up]) Astfel, aceştia nu vor fi influenţaţi în aprecierile lor asupra evoluţiei persoanei testate de cunoaşterea apartenenţei la unul sau altul dintre grupurile experimentale În strânsă legătură cu acest punct se găseşte ideea mascării alocării randomizate şi a conceptului de „orb” (blind) Într-un studiu experimental pot fi identificaţi trei tipuri de actori: cei care oferă intervenţia (de exemplu, terapeuţii), cei care beneficiază de intervenţie (de exemplu, clienţii) şi cei care evaluează progresele observate (de exemplu, asistenţii de cercetare) Aşadar putem vorbi în termeni populari de una dintre cele trei variante experimentale de orbire: simplu-orb, dublu-orb sau triplu-orb, în funcţie de câte categorii de actori nu cunosc cărui grup experimental îi aparţine o anumită persoană În domeniul psihologiei este puţin probabil ca toate cele trei categorii de actori implicaţi să poată fi supuşi condiţiei de orbire, deoarece este puţin probabil ca experimentatorul să nu cunoască la ce fel de intervenţie este supusă o anumită persoană În schimb, asistenţii de cercetare care fac evaluarea progresului la nivelul VD şi uneori participanţii (prin includerea unui grup de control de tip placebo) se pot regăsi în situaţia de a nu cunoaşte grupul din care au făcut parte, acest lucru fiind menţinut până la finalul studiului, pentru a nu influenţa răspunsurile lor obţinute în perioada de urmărire (follow-up) Standardele CONSORT (Moher et al , ) recomandă înlocuirea termenilor „orb”, „dublu-orb” sau „triplu-orb” cu precizarea prezenţei sau absenţei condiţiei de orbire, iar în cazul din urmă, cu completarea categoriilor afectate de această condiţie şi prezentarea modalităţilor concrete în care s-a realizat „orbirea” Controlul exercitat prin nivelul de comparaţie ales Aşa cum am precizat încă de la începutul acestui capitol, ideea de control al unor variabile externe este una esenţială pentru succesul oricărui demers experimental Un alt nivel de analiză privind controlul exercitat vizează nivelul comparativ, adică specificul grupului de control ales Din acest punct de vedere, rezultatele grupului experimental pot fi comparate cu cele ale unui grup de control care poate lua forme diferite precum: (a) control prin absenţa tratamentului; (b) control prin aplicarea unei intervenţii uzuale (ce se întâmplă de obicei); (c) control prin compararea cu intervenţia standard (cea mai bună soluţie existentă în acel moment); (d) control prin raportarea la o altă formă de intervenţie etc Din acest punct de vedere Kazdin ( ) expune principalele tipuri de grup de control, sintetizate în tabelul Tabelul Tipuri de grup de control (lot martor) în funcţie de scopul cercetării Denumire şi descriere Utilitate (scop vizat) Probleme  Grup cu intervenţie absentă (no treatment group) Cei din grupul de control nu primesc niciun fel de intervenţie Se verifică dacă intervenţia are un efect Este vorba însă despre un efect ce incorporează şi efectul determinat de alte aspecte, cum ar fi efectul placebo În anumite situaţii, absenţa unei intervenţii este discutabilă etic, îndeosebi dacă sunt avute în vedere cazuri medicale sau educaţionale în care participanţii la studiu au nevoie de o intervenţie Se constată un număr mai mare de refuzuri de a participa la studii atunci când participanţii realizează că pot fi distribuiţi în grupul care nu primeşte niciun fel de tratament Se observă un număr mai mare de refuzuri pentru a fi evaluaţi la nivel de posttest Creşte potenţialul de risc la nivelul validităţii de construct a rezultatelor obţinute  Grup cu intervenţie amânată (waiting list group) Cei din grupul de control primesc intervenţia doar la finalul derulării cercetării (posttest finalizat), uneori chiar după finalizarea perioadei de urmărire (follow-up finalizat) Se verifică dacă intervenţia are un efect Poate fi aplicată doar în anumite situaţii (nu în situaţii acute/care necesită intervenţii imediate, deoarece ar ridica aceleaşi probleme etice ca şi în condiţiile absenţei intervenţiei) Dacă implementarea intervenţiei în grupul de control se realizează după evaluarea de la nivel de posttest, nu mai pot fi analizate efectele din perioada de urmărire (follow-up) Se observă un număr mai mare de refuzuri de participare la studiu, ce creşte cu cât perioada de aşteptare este una mai lungă Durată mai lungă (dublă) de derulare a studiului  Grup cu intervenţie nespecifică (placebo sau nespecific intervention) Cei din grupul de control primesc o intervenţie, pe care clienţii o percep ca fiind credibilă (utilă) pentru problema lor, dar care nu se bazează pe factorii activi vizaţi Se verifică dacă intervenţia vizată este responsabilă pentru efectul obţinut şi nu alte aspecte nespecifice precum (efectul placebo, alţi factori comuni, nespecifici etc ) Obţinerea unor diferenţe semnificative între grupul experimental şi cel de control ar oferi doar siguranţa că nu factorii comuni/placebo sunt responsabili pentru efectul observat, dar nu vor oferi detalii despre care element specific este responsabil pentru efectul observat Dificultatea de a dezvolta intervenţii care să fie percepute de participanţi drept acţiuni credibile pentru înlăturarea problemei constatate Soluţie, uneori discutabilă din punct de vedere etic Creşterea numărului de participanţi la studiu, deoarece mărimea efectului este mai mică dacă se compară tratamentul activ cu cel de tip placebo decât dacă se compară intervenţia activă cu „absenţa intervenţiei” sau cu „lista de aşteptare”  Grup cu intervenţie uzuală (usual care) Cei din grupul de control urmează procedurile existente la momentul respectiv Se verifică dacă intervenţia vizată este mai bună decât cea uzuală Preferabilă etic în faţa soluţiilor menţionate anterior deoarece şi grupul de control beneficiază de o intervenţie activă Ceea ce se înţelege prin intervenţie uzuală poate varia de la o situaţie la alta, chiar pentru aceeaşi problemă De exemplu, pentru reducerea absenteismului, o şcoală poate avea implementată o strategie clară bazată pe discuţii cu părinţii şi cu psihologul şcolar, în timp ce o altă şcoală apelează uzual la o discuţie între diriginte şi elev, urmată de informarea telefonică a părinţilor Rezultatele studiului ar fi astfel dependente de locaţia unde s-ar derula studiul Există un nivel mai scăzut de standardizare în implementarea (aplicarea) procedurilor implicate în intervenţia uzuală, fapt ce poate afecta încrederea în validitatea comparaţiei realizate Creşterea numărului de participanţi comparativ cu cazul primelor două tipuri de grupuri de control („absenţa tratamentului sau aşteptarea”)  Grup cu intervenţie recomandată (golden standard treatment group) Cei din grupul de control urmează intervenţia care la momentul respectiv este recunoscută ca fiind cea mai întâlnită şi mai eficientă formă de acţiune pentru problema avută Se verifică dacă intervenţia vizată este mai bună, cel puţin egală sau măcar nu este inferioară intervenţiei considerate la momentul respectiv ca fiind cea mai eficientă sau cea mai răspândită soluţie Necesită cel mai ridicat număr de participanţi, comparativ cu celelalte strategii prezentate anterior, deoarece mărimile efectului privind diferenţele dintre cele două grupe au deseori valori scăzute Este considerată a fi cea mai dezirabilă soluţie din punct de vedere etic  Strategia aditivă Cazul este întâlnit atunci când grupul experimental beneficiază de o intervenţie activă suplimentară (de exemplu, terapie, în plus faţă de medicaţie), iar performanţa se compară cu un grup de „control” care primeşte doar medicaţie Se verifică dacă intervenţia adăugată (combinată) poate aduce un beneficiu suplimentar (incremental) faţă de implementarea unei intervenţii singulare Necesită un număr ridicat de participanţi, deoarece câştigul adăugat de un eventual al doilea element activ nu este la fel de mare ca şi diferenţa existentă atunci când comparăm cazul aplicării unui element activ cu absenţa oricărui element activ Necesită mai multe resurse pentru a putea fi implementată Poate fi implementată doar dacă în prealabil au fost colectate dovezi cu privire la eficienţa intervenţiilor singulare sau dacă se aşteaptă ca una dintre strategii să potenţeze efectul celeilalte (să joace un rol moderator)  Strategia derivativă În acest caz nu se poate vorbi propriu-zis de un grup de control, deoarece ambele grupe primesc: (a) fie acelaşi tip de intervenţie în gradiente diferite (expunere la stimuli timp de minute sau de minute); (b) fie forme variate ale aceluiaşi tip de intervenţie (terapie cognitiv-comportamentală centrată pe combaterea cogniţiilor iraţionale asociate toleranţei scăzute la frustrare vs asociate autodeprecierii) Se verifică ce modificări în intervenţie pot conduce la creşterea eficienţei acesteia Se analizează care componente din cadrul intervenţiei sunt responsabile pentru efectul observat Cum poate fi optimizată intervenţia? În absenţa introducerii unui grup de control , acest tip de design necesită cel mai mare număr de participanţi pentru a asigura o putere statistică optimă în testarea ipotezelor Are avantajul de a trece dincolo de simpla discuţie despre prezenţa sau absenţa unei relaţii de tip cauză-efect spre a oferi explicaţii cu privire mecanismele cauzale implicate (mecanismele schimbării) Desigur, poate fi implementată doar după ce există deja dovezi cu privire la eficienţa intervenţiei analizate, la nivel global (molar)  Întreaga discuţie menţionată anterior porneşte de la premisa necesităţii existenţei unui grup de control, pentru a putea analiza dacă eventualele modificări observate la nivelul grupului experimental sunt cauzate de variabila independentă manipulată În absenţa unui asemenea grup comparativ, nu vom putea determina dacă modificările sunt cauzate de aceşti factori sau de alţi factori care ar putea intra în categoria variabilelor confundate (vezi şi secţiunea destinată riscurilor la nivelul validităţii interne din capitolul ) De exemplu, stabilirea eficienţei terapiei cognitiv-comportamentale în ameliorarea simptomatologiei asociate enurezisului prin apelul la un design cu un singur grup pretest-posttest, fără grup de control, nu poate fi stabilită deoarece eventualele ameliorări observate pot fi cauzate atât de intervenţia în sine, cât şi de procesul normal de maturare (reducerea simptomatologiei pe măsura înaintării în vârstă) La fel de important de reţinut este şi influenţa diferenţiată pe care o are tipul de grup de control asupra validităţii concluziilor unui studiu De exemplu, alipirea unui grup de control de tipul absenţei tratamentului va permite eliminarea explicaţiei alternative conform căreia maturarea ar fi elementul responsabil, deoarece atât grupul experimental, cât şi cel de control trec prin aceleaşi condiţii Însă un asemenea design nu ar putea permite unui autor să afirme că reducerea cogniţiilor iraţionale ar fi responsabilă pentru ameliorarea simptomatologiei deoarece nu a existat un grup de control activ (placebo, intervenţie uzuală) care să elimine impactul factorilor comuni (nespecifici) De asemenea, nu s-ar putea valida nici afirmaţii cum ar fi: (a) terapia respectivă este cea mai eficientă soluţie pentru combaterea enurezisului (în lipsa unor grupuri de control active precum grupurile de intervenţie recomandată); (b) terapia ar trebui utilizată ca tratament adjuvant la medicaţie (atât timp cât nu există dovezi că acţiunea lor combinată ar fi mai eficientă decât utilizarea exclusivă a tratamentului medicamentos) Studiile randomizate controlate În situaţia în care studiile experimentale sunt utilizate în contexte specifice cercetării pentru a răspunde la întrebări precum: (a) „este intervenţia X una eficientă?”; (b) „care componentă a intervenţiei X este responsabilă pentru eficienţa intervenţiei (care este mecanismul schimbării)?”; (c) „este intervenţia X la fel de eficientă în cazul şcolarilor mici precum în cazul liceenilor?” etc , soluţia metodologică potrivită este aceea de a realiza studii randomizate controlate (randomized controlled trial) Deşi cele mai multe studii randomizate controlate sunt efectuate în domeniul ştiinţelor medicale, aplicabilitatea lor este extinsă la o sferă mult mai largă de domenii, precum domeniul clinic/al psihoterapiei dominant în psihologie, cel educaţional, domeniul juridic, domeniul organizaţional, domeniul politicilor publice etc Din perspectiva paradigmei oricărei ştiinţe validate ştiinţific (aspectul principal analizat în lucrarea de faţă), aceste studii sunt esenţiale, deoarece au cel mai ridicat nivel de validitate internă, prin urmare concluziile acestor studii prezintă cel mai scăzut risc de a fi distorsionate În titulatura acestui gen de studii se regăsesc sintagmele „randomizate”, respectiv „controlate”, acestea fiind specifice oricărui studiu experimental În consecinţă, aspectele discutate în secţiunile anterioare ale acestui capitol se aplică şi pentru acest tip particular de studii experimentale În plus, o serie de amănunte specifice studiilor randomizate controlate au fost conceptualizate (vezi standardele CONSORT, Schulz et al , ; Moher et al , ) şi merită discutate în continuare, în ideea facilitării implementării acestui gen de studii în spaţiul românesc Prima idee care ar trebui reţinută în legătură cu studiile randomizate controlate este aceea că sub umbrela acestei expresii intră o varietate de studii, a căror clasificare sintetică după criterii variate se regăseşte în figura  Figura Clasificarea studiilor randomizate controlate după criterii variate O scurtă descriere a elementelor menţionate în figura se regăseşte în tabelul următor, cu menţiunea că o detaliere a diferenţelor cele mai importante dintre diferitele tipuri de studii randomizate este prezentată în secţiunea , în care sunt descrise pe larg etapele unui prototip de studiu randomizat controlat Tabelul Descrierea succintă a aspectelor menţionate în figura Criteriu: nivelul de control al variabilelor străine — Studiile cauzale (efficacy studies) au drept caracteristică un control strict al tuturor variabilelor străine la toate nivelurile (în selectarea participanţilor eligibili în cadrul studiilor; în monitorizarea aplicării într-o manieră integră a intervenţiei; în selectarea variabilelor dependente primare etc ) Prin aceste măsuri asiguratorii se are în vedere obţinerea unei validităţi interne ridicate pentru concluziile studiului, fapt ce permite inclusiv identificarea unor relaţii de tip cauză-efect şi/sau a mecanismelor schimbării implicate — Studiile pragmatice (effectiveness studies) au drept caracteristică un control mai relaxat al unor variabile importante pentru studiu, în ideea replicării situaţiilor din realitate Astfel, în studiile pragmatice, criteriile de eligibilitate pentru selectarea participanţilor sunt mai puţin stricte şi se acceptă devieri faţă de cele specificate în protocolul de implementare a intervenţiei, iar variabilele dependente selectate sunt cele importante/relevante pentru societate/individ (de obicei, aspecte comportamentale) Prin aceste măsuri asiguratorii se are în vedere îndeosebi obţinerea unei validităţi externe (ecologice) ridicate Dat fiind specificul celor două tipuri de studii, studiile cauzale ar trebui să preceadă temporal studiile pragmatice, acestea din urmă având sens doar dacă în primele se identifică o relaţie de tip cauză-efect Mai multe detalii despre diferenţele dintre aceste tipuri de studii sunt prezentate în secţiunea Criteriu: designul utilizat — Designul de bază cu grupe paralele (parallel groups sau parallel arms) reprezintă, de departe, cel mai frecvent design întâlnit în studiile randomizate controlate, constând în compararea a două sau mai multe grupe diferenţiate la nivelul modalităţilor variabilei independente (de exemplu, compararea terapiei raţional-emotive, cu un grup de control de tipul listei de aşteptare privind ameliorarea simptomatologiei depresive) Modelul standard de lucru într-un design cu grupe paralele presupune: (a) verificarea eligibilităţii participanţilor la studiu, cu ocazia evaluării la nivel de pretest; (b) randomizarea participanţilor în grupe şi aplicarea intervenţiei (pentru grupul experimental); (c) evaluarea şi compararea efectelor aplicării, respectiv neaplicării intervenţiei la momentul postintervenţie; (d) evaluarea şi compararea efectelor intervenţiei la finalul perioadei de urmărire (follow-up) — Designul de bază cu grupe încrucişate (cross-over design/groups/arms) reprezintă o extensie a modelului cu grupe paralele, prin faptul că după realizarea primilor trei paşi (după măsurarea şi compararea efectelor observate la grupul experimental, respectiv cel de control, de la momentul postintervenţie), cele două grupe îşi schimbă rolul, astfel încât intervenţia activă este aplicată asupra fostului grup de control, în timp ce fostul grup experimental devine grupul de aşteptare (de control) Acest design este rar întâlnit în domeniul ştiinţelor sociale din cauza efectului de reportare (carry-over), a prelungirii duratei cercetării sau a renunţării de a studia efectele la finalul perioadei de urmărire (follow-up) — Designul factorial (factorial design) reprezintă cazul în care grupele studiului sunt alcătuite în baza combinării a două (cel mai adesea) sau mai multe variabile independente Un exemplu în acest sens ar fi un studiu în care se urmăreşte dacă un program de consiliere psihologică ar fi eficient în a-i determina pe adulţi să renunţe la fumat, în contextul în care se doreşte a se ţine seama şi de eficienţa deja dovedită a plasturilor cu conţinut de nicotină Din încrucişarea celor două variabile independente rezultă patru celule experimentale posibile: participanţi care vor primi atât consiliere psihologică, cât şi tratament farmaceutic prin aplicarea de plasturi; participanţi care vor beneficia doar de consiliere psihologică; participanţi care vor primi doar tratament farmaceutic şi participanţi aflaţi în grupul de control (fără intervenţie) Avantajul designului factorial faţă de celelalte tipuri de design constă în posibilitatea de a studia efectul de interacţiune dintre cele două tipuri de intervenţii Dezavantajul constă în consumul ridicat de resurse şi în necesitatea identificării mai întâi a două forme diferite de intervenţie posibile (eficiente), aspecte care fac ca acest tip de design să fie mai rar întâlnit comparativ cu designul bazal cu grupe paralele Criteriu: obiectivul major al studiului — Demonstrarea unei relaţii de tip cauză-efect este cel mai frecvent obiectiv întâlnit în cadrul studiilor randomizate controlate, primele întrebări fiind adesea: „Este această intervenţie eficientă? Se poate spune că există o relaţie de tip cauză-efect între expunerea la X şi apariţia efectului Y?” Acest tip de obiectiv poate fi atins prin acordarea unei atenţii deosebite aspectelor de validitate internă ale unei cercetări, de aceea el este atins prin studii cauzale (vezi primul criteriu) — Identificarea mecanismelor schimbării reprezintă un alt obiectiv important ce este adresat prin intermediul studiilor randomizate controlate, această întrebare fiind pusă după demonstrarea unei relaţii de tip cauză-efect Prin intermediul acestui obiectiv se vizează răspunsuri la întrebări de genul: „Ce componentă a intervenţiei/ce anume din intervenţie a condus la apariţia unei relaţii de tip cauză-efect?”, „Care este elementul activ?”, „Ce aspecte din cadrul intervenţiei sunt responsabile pentru apariţia unei relaţii de tip cauză-efect?” Acest tip de obiectiv poate fi atins doar prin intermediul unei forme particulare de studii cauzale (efficacy studies), pe care am etichetat-o în capitolul ca cercetare de tip cauzal-explicativ — Din perspectiva unei abordări validate ştiinţific, după demonstrarea unei relaţii de tip cauză-efect (este intervenţia eficientă?), după identificarea mecanismelor schimbării responsabile (de ce intervenţia este una eficientă?) se poate stabili dacă intervenţia are un raport cost-eficienţă sau cost-utilitate pozitiv (cât de rentabilă este intervenţia?) Deşi acest tip de întrebare poate fi abordat prin designuri de cercetare multiple (inclusiv de tip non-experimental), cel mai potrivit design este cel experimental (preferabile de această dată fiind studiile pragmatice, pentru a evidenţia costurile şi efectele obţinute într-un context cât mai apropiat de realitate, în condiţiile menţinerii unui control asupra unor potenţiale variabile străine) Criteriu: transparenţa intervenţiei primite — Studiile care includ condiţia placebo (placebo/sham studies) reprezintă standardul de lucru în domeniul ştiinţelor medicale Acest lucru presupune mascarea intervenţiei active, prin intermediul unor intervenţii nespecifice (neactive), cât mai apropiate de intervenţia activă pentru a elimina anumite distorsiuni posibile care apar în contextul în care participanţii cunosc faptul că nu sunt incluşi în grupul experimental activ (vezi efectul Hawthorne sau efectele de demoralizare cu consecinţe negative, inclusiv la nivelul creşterii procentului de renunţare la studiu din rândul participanţilor incluşi în grupele inactive) Pentru a potenţa efectele pozitive, studiile care ţin seama de efectul placebo ar trebui să apeleze la o măsură suplimentară de siguranţă Ar fi indicat nu numai ca participantul să nu cunoască exact grupul din care face parte, ci şi cei care implementează studiul (aplică intervenţia) sau efectuează evaluările pentru a detecta prezenţa sau absenţa unui efect să nu ştie din ce grup face parte un participant Dacă mascarea grupului de apartenenţă este posibilă pentru toate cele trei categorii de actori vorbim despre un design triplu-orb, dacă mascarea este posibilă doar pentru două categorii de actori avem un design dublu-orb În contextele specifice domeniului psihologiei este destul de greu să se implementeze studii de tip placebo (design orb pentru participanţi) sau designuri cu un nivel de mascare mai complexă (deoarece, spre exemplu, psihoterapeutul sau trainerul trebuie să ştie ce fel de intervenţie să aplice asupra unei persoane anume) Totuşi, în cazul studiilor din sfera psihologiei este posibilă mascarea pentru o categorie de actori, aceia care realizează evaluările, măsurând efectele produse de intervenţie la diferite intervale de timp Acest lucru este necesar mai ales dacă măsurile colectate au un caracter subiectiv (observaţii), caz în care cunoaşterea grupului căruia îi aparţine o anumită persoană ar putea conduce la aprecieri distorsionate, care să favorizeze efectul intervenţiei — Studiile deschise (transparente) (open studies) reprezintă acele situaţii experimentale în care toţi participanţii implicaţi activ (participanţi, traineri, evaluatori) cunosc cărui grup îi aparţine fiecare persoană inclusă în studiu În acest gen de studii, pentru a reduce eventualele distorsiuni legate de menţinerea unora dintre participanţi în grupe inactive, ar fi preferabil să se utilizeze grupe de control active (intervenţii uzuale, intervenţii recomandate/comparative) O altă soluţie recomandabilă ar fi aceea de a selecta drept variabile dependente principale măsuri fiziologice sau comportamentale care să fie mai puţin susceptibile la distorsiune comparativ cu măsurile de tip autoraportare (self-report) sau hetero-raportare (peer-report), mai ales dacă grupul de control este unul de tip inactiv (fără intervenţie sau listă de aşteptare) În sfârşit, o altă recomandare ar fi să se ia în considerare preferinţele participanţilor şi să se analizeze impactul acestora în rezultatele finale (efectul observat la participanţii distribuiţi în grupul A la cei care preferau să fie distribuiţi în această intervenţie comparativ cu efectul participanţilor din grupul A care ar fi preferat să fie distribuiţi în grupul B) Criteriu: unitatea supusă randomizării — Individul reprezintă soluţia standard de lucru în studiile randomizate controlate Astfel, randomizarea participanţilor la studiu în condiţiile experimentale se face individual, aceasta fiind soluţia preferabilă ori de câte ori este posibil acest lucru, pentru a asigura un control strict al variabilelor străine care ţin de caracteristicile indivizilor incluşi în studiu Detalii suplimentare despre acest tip de studiu vor fi prezentate în continuarea acestei secţiuni — Grupul natural reprezintă soluţia alternativă de alocarea randomizată a indivizilor în condiţiile experimentale, atunci când nu este fezabilă randomizarea la nivel individual Acest nivel de randomizare poartă denumirea de randomizare cluster Pentru a fi la fel de eficientă precum randomizarea la nivel de individ, randomizarea la nivel de cluster trebuie să respecte câteva condiţii, discutate în secţiunea Acest gen de randomizare este uneori singura soluţie (de exemplu, în medii organizaţionale sau şcolare unde s-ar putea obţine cu greu acceptul de a redistribui echipele de muncă/clasele de elevi) În acest context, elementele randomizate vor fi clasele/echipele din care participanţii fac parte în mod natural Avantajul acestui tip de randomizare în condiţiile lucrului în medii cu grupuri naturale gata formate (departamente, clase etc ) este acela de a împiedica diseminarea informaţiei din grupurile active şi de a reduce efectele de tip Hawthorne sau cel de demoralizare/demotivare) Detalii despre randomizarea la nivel de cluster găsiţi în secţiunea Criteriu: momentul randomizării — Modalitatea standard de lucru într-un studiu randomizat controlat este aceea de a aloca aleatoriu participanţii eligibili în grupele experimentale după ce aceştia au citit în prealabil informaţii despre studiu şi au consimţit să participe la studiu, fără a avea dreptul de a alege grupa experimentală în care vor fi distribuiţi Această variantă este atât de frecvent întâlnită, încât nici nu are o titulatură specifică, fiind, de altfel, varianta preferabilă şi din punct de vedere etic Problema identificată cu acest tip de design este aceea că el nu ia în considerare impactul preferinţelor participanţilor (deşi în general efectul unei intervenţii tinde să fie mai ridicat în cazul pacienţilor atraşi de intervenţia respectivă şi mai scăzut în cazul celor care au o opinie nefavorabilă faţă de intervenţia respectivă) Alocarea randomizată nu rezolvă întotdeauna această problemă De exemplu, în cazul reducerii durerii postoperatorii este posibil ca majoritatea participanţilor să prefere apelul la farmacoterapie (din motiv de timp sau confort) decât să fie distribuiţi într-un grup de psihoterapie, iar această inegalitate în preferinţe poate afecta validitatea internă a rezultatelor obţinute — Metoda alternativă de lucru, cunoscută sub denumirea de metoda Zelen (apud Torgerson şi Torgerson, ), presupune randomizarea participanţilor în grupele studiului înainte de a cere acceptul acestora de a participa la studiu Pentru a considera această soluţie acceptabilă din punct de vedere etic (în contextul în care participanţii nu cunosc faptul că au fost alocaţi aleatoriu anterior, fără acceptul lor), ea poate fi utilizată în contexte în care grupul de control primeşte un tratament activ (cel puţin intervenţia uzuală sau intervenţia standard/recomandată) În varianta simplă a metodei Zelen, doar participanţii incluşi în grupul care primeşte intervenţia inovativă sunt chestionaţi cu privire la preferinţa lor, iar cei care se declară împotriva tratamentului inovativ sunt incluşi în grupul de control (beneficiar al intervenţiei recomandate/uzuale) În varianta dublă, prin metoda Zelen sunt chestionate ambele categorii de indivizi, atât cei alocaţi grupului experimental, cât şi cei alocaţi grupului de control, urmând ca participanţii care ar prefera celălalt tratament existent să fie realocaţi conform preferinţei lor Un aspect tehnic important legat de aceste proceduri, pentru a menţine studiul în categoria studiilor randomizate, este faptul că analiza statistică a rezultatelor se face ţinând cont de recomandările strategiei intenţiei de a trata (intention to treat) (vezi secţiunea ) În cazul de faţă, acest lucru înseamnă că rezultatele celor două grupe sunt analizate pornind de la compoziţia iniţială a grupelor în urma randomizării De exemplu, indivizii care au fost realocaţi pentru a primi intervenţia B datorită preferinţei lor, vor fi analizaţi ca făcând parte din grupul A, unde fuseseră iniţial repartizaţi aleatoriu, în baza strategiei bazată pe intenţia de a trata Desigur, o asemenea soluţie este posibilă dacă numărul celor realocaţi în total între grupe nu este unul ridicat (sub - %), altfel fiind afectate concluziile finale din cauza mixării intervenţiilor O alternativă posibilă în analiza datelor provenite dintr-un studiu ce apelează la metoda Zelen este analiza standard a datelor, dublată de efectuarea unor analize suplimentare cu referire la impactul pe care preferinţa participanţilor pentru o anumită intervenţie îl joacă asupra rezultatelor finale Criteriu: scopul comparaţiei — Demonstrarea superiorităţii unei intervenţii (grupul experimental) în faţa grupului de control este varianta tipică întâlnită în studiile randomizate controlate, fiind extrem de răspândită Scopul ei este de a urmări în ce măsură o intervenţie poate fi considerată a fi semnificativ mai eficientă decât alte soluţii supuse comparării Absenţa unui rezultat semnificativ statistic în urma comparării unor intervenţii, fie ele A şi B, nu înseamnă automat că cele două intervenţii sunt echivalente sau că se află într-o relaţie de non-inferioritate una faţă de cealaltă — Demonstrarea echivalenţei dintre două intervenţii se întâlneşte atunci când o intervenţie nouă este comparată cu o intervenţie a cărei eficienţă a fost demonstrată, pentru a arăta că ambele au un nivel similar de eficienţă Demonstrarea non-inferiorităţii unei intervenţii este utilizată atunci când se doreşte a se arăta că o intervenţie nouă nu este mai puţin eficientă (inferioară) unei intervenţii consacrate pentru problema respectivă În ambele cazuri se defineşte un interval marginal (o diferenţă Î” considerată ca fiind maximumul distanţei posibile dintre două intervenţii care nu are un impact practic [clinic] – de exemplu, mărimea efectului de intensitate mică) Spre ilustrare, două intervenţii sunt considerate echivalente în tratamentul depresiei dacă diferenţele sesizate nu sunt semnificative statistic şi dacă ele se regăsesc în intervalul stabilit anterior (de exemplu, o diferenţă de ± puncte între mediile celor două grupe comparate la o probă care evaluează nivelul depresiei) Transpus în termeni de non-inferioritate, am spune despre o intervenţie menită să combată depresia că ea este non-inferioară alteia consacrate, dacă diferenţa dintre medii nu este semnificativă statistic şi dacă nivelul mediu al depresie din grupa care a beneficiat de intervenţia experimentală nu este mai mic de puncte faţă de nivelul mediu al depresiei din grupul care a primit intervenţia standard (recomandată) Aşadar, echivalenţa se transpune în termenii unei ipoteze bilaterale, în timp ce non-inferioritatea este specifică unor ipoteze unilaterale În cazul demonstrării echivalenţei/non-inferiorităţii unei intervenţii noi, comparativ cu intervenţia standard, noua intervenţie poate deveni prima opţiune/soluţie dacă ea posedă alte caracteristici superioare (cum ar fi costuri mai reduse, acceptabilitate mai ridicată din partea beneficiarilor, durată mai redusă de implementare, aria de diseminare mai largă etc ) Mai multe detalii privind implicaţiile metodologice pentru studii randomizate controlate ce vizează demonstrarea echivalenţei/non-inferiorităţii unei intervenţii faţă de un alt tratament activ (recomandat) sunt disponibile în Piaggio et al ( ) Deşi numărul posibilităţilor de a combina diferitele caracteristici ale studiilor randomizate controlate este unul nelimitat, cel mai întâlnit design de acest gen în domeniul psihologiei este cel al unui (a) studiu cauzal (efficacy study) (b) cu un design bazal cu două grupe paralele, (c) deschis sau simplu-orb (prin mascarea apartenenţei la grupe în faţa asistenţilor de cercetare care măsoară evoluţia variabilelor dependente), (d) ce urmăreşte demonstrarea unei relaţii de tip cauză-efect, aspect căruia i se adaugă uneori identificarea mecanismelor schimbării (e) şi în care alocarea randomizată a participanţilor în grupe se face la nivel individual, (f) ulterior obţinerii consimţirii informate din partea participanţilor Din aceste motive, în secţiunea următoare a acestui capitol, vom detalia etapele realizării unui asemenea studiu-prototip, oferind însă specificaţii paralele suplimentare cu rol comparativ pentru situaţia studiilor pragmatice (effectiveness) Etapele derulării unui studiu randomizat controlat Pentru a structura conţinutul acestei secţiuni, vom apela la reprezentarea grafică a unui studiu randomizat controlat, conform standardelor CONSORT (Moher et al , ), care are în vedere etapele acestui proces: (a) recrutarea şi selectarea participanţilor (enrollment); (b) alocarea randomizată a participanţilor şi derularea intervenţiilor; (c) urmărirea evoluţiei acestora (follow-up); (d) analiza statistică a rezultatelor Etapa de recrutare şi selecţie a participanţilor Aparent, această etapă pare una mai facilă, cel puţin comparativ cu celelalte etape implicate într-un studiu randomizat controlat În realitate, însă, nu mai puţin din % dintre studiile de acest gen au apelat la o extindere a perioadei de recrutare pentru a-şi atinge numărul dorit de participanţi eligibili, iar % dintre studii s-au derulat cu un număr de participanţi sub nivelul a % din numărul estimat (dorit) iniţial (McDonald et al , )  Figura Diagrama etapelor existente în implementarea unui studiu randomizat controlat cu două grupe paralele, cu un grup de control activ – intervenţie uzuală O recrutare de succes este aceea care reuşeşte să strângă în intervalul de timp prestabilit numărul de persoane eligibile pentru a primi intervenţia, aşa cum s-a estimat iniţial pentru a asigura o putere statistică optimă de a detecta efectul intervenţiei asupra variabilei dependente principale (primary outcome) În demersul de recrutare se poate apela la orice mijloc de promovare a studiului, de la publicitatea efectuată în mass-media locală la extinderea numărului de locaţii (instituţii colaboratoare care implementează studiul) şi la oferirea de stimulente financiare care să fie acceptabile din punctul de vedere al comitetului de etică a cercetării De exemplu, în SUA, plata acordată direct participanţilor eligibili pentru a fi incluşi în studiu este considerată adecvată doar dacă se rezumă la a acoperi unele cheltuieli ale acestora (cum ar fi cele de deplasare), avantajul constând mai degrabă în oferirea intervenţiei în regim gratuit Recomandabil ar fi însă să fie motivaţi financiari alţi specialişti (de exemplu, profesori, medici etc ) care să ajute la identificarea cazurilor potenţial eligibile (Torgerson şi Torgerson, ) O altă soluţie ingenioasă, de interes pentru organizaţiile orientate spre profit, ar fi aceea de a scrie direct angajatorilor propunându-li-se acestora realizarea de parteneriate (aceştia să îndemne/cointereseze angajaţii să participa la studii) dacă problema vizată va duce la o reducere a cheltuielilor de sănătate (creştere a profitului), cum ar fi cazul programelor destinate reducerii fumatului sau reducerii stresului la locul de muncă (Lando, ) Participanţii identificaţi ca fiind potenţial eligibili sunt evaluaţi iniţial pentru a determina dacă ei îndeplinesc într-adevăr criteriile de includere în studiu, respectiv dacă nu intră sub incidenţa unor criterii de excludere Aceste criterii sunt stabilite a priori, fiind mai restrictive în cazul studiilor cauzale decât în cazul celor pragmatice Desigur, indicat ar fi să fie luate în considerare doar acele criterii de includere/excludere care au relevanţă pentru obiectivul cercetării, astfel încât să nu fie afectată validitatea internă (pe de o parte – vezi cazul studiilor cauzale), dar şi să fie potenţată validitatea externă a studiului (capacitatea de generalizare a concluziilor – vezi cazul studiilor pragmatice) Un alt rol al acestei evaluări iniţiale este de a colecta rezultatele participanţilor la studiu la momentul preintervenţiei (pretest), ce vor fi utilizate ulterior în analizele statistice Un aspect important de menţionat cu privire la această etapă este aspectul temporal Astfel, în multe cazuri, etapa de recrutare şi selecţie se realizează integral înaintea începerii studiului, aşa cum este prezentată şi situaţia din figura Totuşi, în studiile în care este nevoie de mulţi participanţi sau în care participanţii sunt greu de găsit, o soluţie posibilă este aceea de a suprapune etapa de recrutare cu etapele ulterioare de derulare a studiului, caz în care vorbim de o recrutare secvenţială (de exemplu, este posibil ca la momentul recrutării ultimilor participanţi necesari pentru studiu, primii indivizi recrutaţi să fie deja în perioada de urmărire [follow-up]) Ceea ce este important în aceste cazuri este ca intervenţia să aibă o durată şi activităţi standard şi să existe un procent relativ egal de persoane distribuite în grupul experimental, respectiv de control, într-o anumită etapă, astfel încât să fie controlate eventuale efecte sezoniere sau efecte ce ţin de instrumentare (variaţii în familiarizarea cu sarcina) Caseta Ilustrarea unor criterii de includere/excludere în cazul ipotetic al unui studiu randomizat controlat care urmărea impactul psihoterapiei în combaterea depresiei majore A Studiu cauzal Participanţii eligibili sunt cei: (a) cu vârste cuprinse între şi de ani; (b) care au fost diagnosticaţi ca având tulburare depresivă majoră conform standardelor DSM IV; (c) care nu prezintă alte comorbidităţi psihiatrice; (d) care obţin un scor de cel puţin la proba de depresie Beck; (e) care nu sunt implicaţi în vreo altă formă de tratament pentru ameliorarea simptomatologiei depresive; (f) care se află la primul episod depresiv diagnosticat B Studiu pragmatic Participanţii eligibili sunt cei: (a) cu vârste cuprinse între şi de ani; (b) diagnosticaţi cu tulburare depresivă majoră conform standardelor DSM IV; (c) care nu sunt implicaţi în vreo altă formă de tratament pentru ameliorarea simptomatologiei depresive Participanţii care în urma evaluării iniţiale îndeplinesc condiţiile de eligibilitate sunt solicitaţi să semneze un formular de consimţire informată pentru a putea fi incluşi în studiu, acest procedeu fiind necesar pentru a îndeplini standardele etice în derularea cercetărilor Deşi formatul unui formular de consimţire informată poate varia de la un studiu la altul, în conţinutul ideatic al acestuia ar trebui să se regăsească, indiferent de tipul studiului (experimental, non-experimental etc ), descrieri ale: (a) obiectivului cercetării; (b) duratei studiului, în special ale duratei de implicare activă a participantului la studiu; (c) procedurilor şi sarcinilor care vor trebui urmate (inclusiv ale faptului că participanţii vor fi alocaţi aleatoriu în grupele experimentale, cu descrierea specificului fiecărui tip de intervenţie şi a evaluărilor care vor fi făcute); (d) potenţialelor riscuri existente prin expunerea la intervenţia oferită (implicarea în cercetare); (e) eventualelor beneficii rezultate din participarea la studiu (altele decât stimulentele financiare/academice); (f) stimulentelor financiare/academice (de exemplu, credite suplimentare, scutiri de sarcini, bonus în notare), dacă acestea vor fi acordate, cu precizarea explicită a faptului că acestea nu sunt condiţionate de completarea integrală a sarcinilor prevăzute în studiu/renunţarea pe parcurs la studiu; (g) modului în care va fi asigurată confidenţialitatea datelor şi, dacă este cazul, solicitarea permisiunii de a utiliza unele materiale colectate (fotografii, înregistrări audio) în scop de cercetare; (h) drepturilor participantului la studiu (de a completa doar sarcinile/porţiuni din sarcini în care consimte voluntar, de a se retrage pe parcursul studiului fără a fi penalizat sau a pierde vreun beneficiu câştigat până atunci; de a cere asistenţă gratuită în cazul în care procedurile experimentale i-au creat un disconfort/o problemă de sănătate); (i) datelor de contact (telefon, e-mail, adresă poştală) ale coordonatorului studiului sau ale persoanei desemnate să răspundă la orice problemă/întrebare pe care o au, precum şi a datelor de contact ale unei instanţe superioare, în cazul în care nu sunt mulţumiţi de modul în care le-au fost soluţionate cererile de către coordonatorului studiului/persoana de contact desemnată; (j) declaraţiei-tip a participantului, cu spaţiu pentru a trece olograf numele, semnătura şi data, în care se specifică faptul că formularul a fost citit, iar participantul este de acord cu aspectele specificate Acest formular este redactat în două exemplare, câte unul de fiecare parte (participant, respectiv echipa de cercetare), fiind de asemenea semnat de către coordonatorul studiului Kazdin ( ), unul dintre cei mai mari specialişti în domeniul metodologiei cercetării în psihologie clinică şi psihoterapie, recomandă ca formularul de consimţire informată să aibă următoarele secţiuni/subtitluri: (a) privire de ansamblu asupra studiului (overview); (b) descrierea procedurilor studiului; (c) riscuri; (d) beneficii; (e) stimulente; (f) confidenţialitate; (g) intervenţii alternative disponibile către client (în afara studiului); (h) acordul voluntar – un paragraf cu acordul voluntar al participantului la studiu; (i) date de contact pentru întrebări şi informaţii suplimentare; (j) semnături Un exemplu concret de formular de consimţire informată, folosit într-un studiu clinic controlat realizat în România, este prezentat în caseta Caseta Un model de formular de consimţire informată utilizat într-un studiu randomizat ACORD DE PARTICIPARE LA CERCETARE NUMELE CERCETĂRII (STUDIULUI) Rolul psihoterapiei cognitiv comportamentale în tratamentul chirurgical parodontal: un studiu clinic controlat (PSIDENT) CONSIMŢĂMÂNT INFORMAT Vă rugăm să citiţi cu atenţie acest formular şi să întrebaţi coordonatorul studiului sau membrii echipei de cercetare a studiului orice informaţie pe care nu aţi înţeles-o clar Vă rugăm să vă asiguraţi că toate întrebările dvs au fost clarificate înainte să semnaţi formularul Informaţia obţinută din acest formular şi din discuţiile cu membrii echipei de cercetare vă poate ajuta să vă decideţi dacă doriţi să participaţi în acest studiu de cercetare Dacă optaţi să participaţi, trebuie să vă scrieţi numele şi să semnaţi la sfârşitul formularului şi pe autorizarea de participare la cercetare INTRODUCERE Studiul la care sunteţi invitat să participaţi urmăreşte să evalueze eficienţa intervenţiilor chirurgicale parodontale versus combinaţia între intervenţiile chirurgicale parodontale şi intervenţia psihologică cognitiv-comportamentală în tratamentul persoanelor cu boală parodontală sau retracţii gingivale izolate Este important să ştiţi că: ( ) participarea la studiu este voluntară; ( ) puteţi decide să nu luaţi parte sau puteţi să vă retrageţi din studiu în orice moment În oricare caz, nu veţi pierde niciun beneficiu la care aveţi altfel dreptul Însă, pentru a primi gratuit tratamentul prevăzut în studiu trebuie să acceptaţi participarea în studiu DESCRIEREA STUDIULUI A ELIGIBILITATE Pot participa la studiu persoane cu vârste între - de ani, în bună stare de sănătate generală, care prezintă: â–şuna sau mai multe retracţii gingivale (RG) â‰Ą mm, clasa , sau Miller, fără intervenţii muco-gingivale anterioare în zona vizată sau â–şparodontite cronice sau agresive, care necesită un tratament chirurgical de reducere a pungilor parodontale Criteriile de excludere se referă la: persoanele cu afecţiunile sistemice care contraindică intervenţia chirurgicală, mobilitate dentară de gradul sau , motivaţie insuficientă B PROCEDURĂ Bazat pe acordul dvs voluntar şi verificarea prealabilă a eligibilităţii, puteţi participa în acest studiu care implică o fază de intervenţie chirurgicală şi o fază de urmărire a evoluţiei dvs timp de an, ambele gratuite Toţi participanţii din studiu vor fi evaluaţi înaintea intervenţiei medicale, iar apoi la zile, lună, luni, luni şi an Participanţii eligibili pentru studiu vor fi distribuiţi în grupul de intervenţie chirurgicală parodontală Intervenţia chirurgicală parodontală constă în acoperirea zonelor de retracţie izolată prin procedeul cel mai indicat cazului sau printr-o terapie chirurgicală de reducere a pungilor, cu sau fără adiţie de os Ulterior acestei intervenţii este urmărită evoluţia dvs prin întâlniri stabilite la interval de zile, lună, luni, luni şi an Intervenţia menţionată anterior poate fi primită contra cost în majoritatea serviciilor medicale, atât publice, cât şi private Participanţii la studiu sunt rugaţi să completeze la înrolare şi pe parcursul derulării studiului diverse scale psihologice C RISCURI Efectele secundare ale intervenţiei chirurgicale parodontale se referă la efecte inerente asociate intervenţiei (dureri la locul intervenţiei, tumefieri) şi până la situaţii extreme, rar menţionate de literatura de specialitate (necroza grefei, hemoragii, expunerea şi infecţia membranei, atunci când este folosită) Tratamentul va fi oprit dacă apar unele dintre efectele mai sus menţionate D BENEFICII Beneficiul potenţial al implicării în acest studiu se referă în principal la o reducere a simptomelor asociate bolii de bază pentru care v-aţi adresat medicului, a simptomelor asociate intervenţiei Deşi nu se poate spune că veţi beneficia în procent de % în urma acestor tratamente, studiile anterioare arată că un procent foarte mare de pacienţi îşi rezolvă sau îşi ameliorează semnificativ simptomele şi problemele asociate E CONFIDENŢIALITATE Acordul dvs cu acest formular va autoriza echipa de cercetare să colecteze şi să folosească informaţii din studiu Ţinând cont că informaţia colectată va fi utilizată numai pentru scopuri de cercetare, toate eforturile vor fi mobilizate pentru a nu vă dezvălui identitatea în orice document sau publicaţie rezultate în urma acestui studiu Confidenţialitatea informaţiilor referitoare la dvs va fi în acord cu legile aplicabile F RETRAGEREA Participarea este complet voluntară Manifestarea interesului pentru studiu nu vă obligă să participaţi Chiar dacă la început decideţi să participaţi şi apoi vă răzgândiţi, vă puteţi retrage în orice moment fără penalizări Dacă veţi lua această decizie vă recomandăm: ( ) să anunţaţi decizia dvs (celui care v-a oferit tratamentul) pentru buna derulare a studiului; ( ) să consultaţi obligatoriu un alt medic stomatolog pentru a stabili un alt tratament şi a preveni complicaţiile care ar putea să apară ţinând cont de condiţia dvs De asemenea, pe parcursul cercetării cel care face tratamentul poate să vă recomande consultarea medicului de familie sau a unui alt medic stomatolog pentru a preveni anumite complicaţii; pentru reducerea riscurilor vă rugăm să luaţi în considerare aceste recomandări Echipa de cercetare are de asemenea dreptul de a opri participarea dvs în studiu Această decizie poate fi luată din cauza unor reacţii neaşteptate, a unor eşecuri repetate de a urma instrucţiunile sau din cauză că întreg studiul este oprit G RESPONSABILITATE Acest studiu a fost iniţiat de către Universitatea „Babeş-Bolyai” (Catedra de Psihologie Clinică şi Psihoterapie), Universitatea de Medicină şi Farmacie „Iuliu Haţieganu” (Catedra de Parodontologie), Universitatea de Medicină şi Farmacie „Victor Babeş” din Timişoara şi Institutul de Cercetări pentru Instrumentaţie Analitică Cluj Calitatea şi responsabilitatea tratamentului revine medicului stomatolog care oferă direct tratamentul Tratamentul va fi oferit în cadrul unui orar stabilit de comun acord cu dvs Am citit explicaţiile privind acest studiu şi am avut oportunitatea de a adresa întrebări de clarificare adiţionale Îmi dau acordul pentru participarea la studiu Nume: Semnătură: Dată: Semnarea formularului de consimţire informată reprezintă ultima secvenţă a primei etape, de recrutare şi selecţie, specifică unui studiu randomizat controlat Desigur, etapa de recrutare şi selecţie a participanţilor poate fi considerată drept etapă iniţială, având în vedere implementarea efectivă a studiului Implementarea este precedată, de etapa de planificare a studiului, de etapa de obţinere a acordului pentru derularea studiului din partea unei comisii de etica cercetării şi, desigur, de etapa obţinerii fondurilor necesare pentru acoperirea cheltuielilor cu derularea studiului, considerate a fi etape premergătoare implementării Etapa de derulare a studiului În cadrul acestei etape are loc alocarea randomizată a participanţilor în grupele din cadrul experimentului, se aplică intervenţiile convenite şi au loc măsurători intermediare (aspect opţional), respectiv cele realizate la finalul derulării intervenţiei (evaluare postintervenţie) Alocarea randomizată în grupele experimentale Secvenţa de alocare randomizată a participanţilor a fost descrisă în secţiunea De aceea, ne vom rezuma la a prezenta cele trei caracteristici ale unei alocări randomizate în grupele experimentale considerate a fi necesare pentru o randomizare de o calitate superioară Primul aspect vizează algoritmul de randomizare ales Acesta ar trebui să fie unul adaptat numărului de participanţi de inclus în fiecare grupă, tipului de recrutare (recrutaţi simultan sau secvenţial – vezi figura ) şi să nu permită anticiparea grupei din care face parte un individ (de exemplu, nu este recomandabilă randomizarea sistematică, cu pas, deoarece ordinea de introducere a participanţilor în studiu ar putea fi manipulată de către cercetător, fapt care ar conduce la o distorsiune în selecţie) Cel de-al doilea aspect dezirabil vizează separarea activităţii de stabilire a gradului de eligibilitate a unei persoane pentru a fi inclusă în studiu, de cea care presupune randomizarea participanţilor în grupele experimentale Acest lucru se obţine prin alocarea acestor activităţi unor persoane diferite pentru a reduce riscul unei distorsiuni în selecţie (de exemplu, pentru a evita practica de a-i include pe cei eligibili, dar cu un profil care indică o complianţă scăzută la tratament, să fie incluşi în grupul de control pentru a maximiza şansele obţinerii unor diferenţe semnificative statistic, în direcţia dorită, aceea a superiorităţii lotului experimental) Cea de-a treia caracteristică dezirabilă vizează transparenţa intervenţiilor (condiţia de orbire) Pentru a reduce riscurile apariţiei unor distorsiuni (efect Hawthorne, demoralizare, expectanţe diferite privind evoluţia participanţilor, comportament diferenţiat faţă de participanţi în funcţie de intervenţia primită, distorsiuni în evaluare) ar fi ideal dacă studiul ar fi derulat în condiţii de tip triplu-orb Deoarece este puţin probabil ca acest lucru să fie făcut în cercetări din domeniul psihologiei, mult mai uşoară ar fi implementarea unei condiţii de tip simplu-orb, având drept protagonişti asistenţii de cercetare responsabili pentru evaluările realizate preintervenţie, în timpul intervenţiei, postintervenţie sau în follow-up Acest lucru ar fi necesar mai ales în contextul în care variabilele dependente principale sunt evaluate într-o manieră subiectivă, prin aprecieri ale progreselor făcute Implementarea intervenţiei Această secvenţă trebuie să respecte aspectele planificate şi prezentate în formularul de consimţire informată (de exemplu, durata perioadei de intervenţie, gradientul intervenţiei – numărul de şedinţe) În plus, în această secvenţă există diferenţe importante între studiile cauzale (efficacy studies) şi cele pragmatice (effectiveness studies) În cazul primelor este foarte important să existe o respectare a protocolului iniţial atât din partea celor desemnaţi să implementeze intervenţia, în baza celor cuprinse într-un manual al intervenţiei, cât şi din partea celor care au consimţit să primească intervenţia alocată De asemenea, conţinutul fiecărei întâlniri (şedinţe de implementare) trebuie respectat Din perspectiva implementării unei intervenţii, ar fi necesar să se observe măsura în care livrarea intervenţiei a avut loc conform planului , respectiv măsura în care participanţii la studiu au aderat (au manifestat complianţă) la intervenţia primită Aceste aspecte sunt necesare pentru a aprecia dacă sunt afectate validitatea de construct (livrarea intervenţiei), respectiv validitatea internă a studiului (aderenţa la intervenţie) În cazurile în care se constată abateri substanţiale în implementarea intervenţiei de la cele prevăzute iniţial, se poate ajunge la propuneri de excludere a acestor cazuri din analiză, deoarece devierea semnificativă de la planul iniţial constituie un factor de risc pentru validitatea internă şi validitatea de construct a concluziilor studiului De aceea, acest control strict prezent în studiile cauzele este necesar pentru a reduce erorile sistematice, în ideea de a ne asigura că intervenţia (aşa cum a fost ea planificată) este cea care a condus la efectele obţinute şi nu alte aspecte colaterale, introduse pe parcurs În schimb, studiile pragmatice pornesc de la premisa că este mai importantă reproducerea condiţiilor din realitate (în care trainerii, psihoterapeuţii, deşi au un plan iniţial, pot devia de la acesta în funcţie de nevoile fiecărui participant), decât să se respecte aspectele planificate, deşi acest lucru creşte riscul de a oferi intervenţii ce variază, între anumite limite, de la un participant la altul, cu consecinţe negative asupra validităţii interne şi de construct a concluziilor studiului În schimb, prin această strategie adoptată, studiile pragmatice câştigă în ceea ce priveşte validitatea externă a studiului, îndeosebi cu privire la validitatea ecologică De altfel, pe lângă diferenţele ce ţin de condiţiile de eligibilitate pentru includerea în studiu (mai relaxate în cazul studiilor pragmatice), principala diferenţă dintre studiile cauzale şi cele pragmatice are în vedere modul de implementare a intervenţiilor Cerinţa ca implementarea intervenţiei să se realizeze conform celor explicitate în manualul intervenţiei este mult mai strictă în cazul studiilor cauzale decât în a celor pragmatice Pentru a creşte fidelitatea faţă de propunerea iniţială, cu ocazia implementării unei intervenţii se pot utiliza o serie de strategii menite să sprijine validitatea de construct (Shadish et al , ): (a) în direcţia livrării corecte a intervenţiei, prin existenţa unui manual de implementare a intervenţiei, susţinut de mijloace instructive (casete video demonstrative, discuţii şi feedback corectiv din partea unor supervizori, în baza unor cazuri înregistrate; training în implementare); (b) în direcţia creşterii aderenţei (complianţei) participantului la intervenţie/tratament, prin comunicarea explicită a temelor pentru acasă însoţită de hand-out-uri, quizz-uri periodice de cunoştinţe, discuţii/discursuri motivaţionale, discuţii cu membrii familiei în ideea încurajării implicării în intervenţie, stimularea aderenţei la intervenţie prin oferirea de mici premii (tombolă) etc Un aspect extrem de important, dar deseori neglijat în partea de implementare, se referă la identificarea influenţei unor factori externi deoarece validitatea concluziilor unui studiu controlat nu ţine doar de implementarea corectă a intervenţiei, ci şi de absenţa unor factori străini perturbatori Astfel, este posibil ca participanţii să fie incluşi concomitent în mai multe studii şi să existe, astfel, o interferenţă sau un transfer între intervenţiile primite De asemenea, trebuie verificată situaţia celor incluşi în grupul de control pasiv (fără intervenţie), pentru a observa măsura în care aceştia îşi menţin acest statut pe parcursul intervenţiei sau dacă acţionează individual în vederea ameliorării problemei lor Pe lângă importanţa livrării acurate a intervenţiei un alt factor important, trebuie luat în calcul în legătură cu cei care implementează intervenţia, vizează competenţa acestora de a oferi o intervenţie de calitate În acest sens, se obişnuieşte să se apeleze la persoane care: (a) deţin certificare recunoscută în domeniul intervenţiei (de exemplu, certificat de formator în trainingul sau coaching-ul respectiv, atestat de psihoterapeut în tehnica psihoterapeutică implementată); (b) posedă o experienţă relativ bogată, preferabil atât în aplicarea intervenţiei respective, cât şi în abordarea problemelor supuse spre rezolvare (de exemplu, experienţă în cazuistică depresivă) Desigur, acest aspect nu are un caracter obligatoriu atât timp cât este monitorizată atent partea de livrare a intervenţiei, mai ales dacă se au în vedere aspecte economice (raportul cost-eficienţă) Se cunoaşte faptul că nivelul costurilor unei intervenţii creşte dacă pentru implementarea acesteia se apelează la specialişti decât dacă ea se bazează pe novici În sfârşit, pe parcursul derulării intervenţiei ar fi indicat să se ia măsuri care să conducă la un procent cât mai redus de renunţare la cercetare (dropout sau attrition) De exemplu, ar fi dezirabil, în cazul în care există mai mulţi asistenţi de cercetare, să fie alocată aceeaşi persoană pentru a colecta datele cu ocazia evaluărilor diverse (pentru a ajuta la consolidarea relaţiei interpersonale dintre participanţi şi asistenţi, desigur, dacă nu au existat conflicte între cele două părţi) De asemenea, i se poate aduce aminte periodic participantului despre importanţa studiului pentru cunoaştere sau i se pot oferi stimulente pentru participare (inclusiv mici cheltuieli de protocol – apă, fursecuri) În plus, pentru a preveni absenteismul de la şedinţele de intervenţie, se poate trimite un SMS sau e-mail de reamintire cu privire la data, ora şi locaţia următoarei şedinţe O altă măsură deosebit de utilă este aceea de a reduce perioada de timp existentă între semnarea formularului de consimţire informată şi implementarea efectivă a intervenţiei Evaluări colectate cu ocazia derulării intervenţiei Orice studiu randomizat controlat cuprinde obligatoriu o secvenţă de evaluare realizată postintervenţie, pentru a urmări diferenţele observate între grupele incluse în studiu Această evaluare este necesară pentru a demonstra existenţa unei relaţii cauzale În funcţie de natura grupului de control, rezultatul obţinut la nivel de postintervenţie poate fi utilizat pentru a arăta că: (a) intervenţia este una eficientă (control exercitat prin liste de aşteptare/absenţa intervenţiei); (b) efectul se datorează caracteristicilor specifice ale intervenţiei (control exercitat prin placebo/intervenţii nespecifice); (c) intervenţia este mai bună, cel puţin la fel de bună sau nu este inferioară alteia (control exercitat prin intervenţii uzuale, intervenţii recomandate, intervenţii standard) etc Desigur, pentru a potenţa comparaţiile făcute şi efectele obţinute, modelul standard de studiu randomizat controlat presupune evaluări ale variabilei dependente primare, atât la nivel de preintervenţie, cât şi la finalul perioadei de urmărire, adică la un anumit interval de timp după încheierea aplicării intervenţiei În schimb, dacă obiectivul urmărit prin studiu nu este doar acela de a demonstra existenţa unei relaţii de tip cauză-efect, ci vizează identificarea unor mecanisme psihologice responsabile pentru schimbarea obţinută, atunci etapa de derulare a intervenţiei va cuprinde suplimentar, pe lângă evaluarea VD, măsurători şi ale potenţialelor variabile mediatoare (cu rol explicativ pentru schimbările observate) În plus, pe lângă momentele standard (preintervenţie, postintervenţie şi finalul perioadei de urmărire), se apelează la una sau mai multe evaluări intermediare (pe parcursul intervenţiei), atât privind nivelul variabilelor dependente, cât şi cel al potenţialelor variabile mediatoare (mecanisme ale schimbării) Tabelul Momente ale evaluării în funcţie de obiectivul studiului Mecanismele schimbării Evaluarea mediatorilor Evaluarea relaţiei cauză-efect Evaluarea VD  Tip de design Pre Interim Post Urm Pre Interim Post Urm  Standard (demonstrarea unei relaţii cauzale) O O O O X O X X  Identificarea mecanismelor schimbării X X X X X X X X  Legendă: X – evaluare; O – absenţa evaluării Aceste evaluări intermediare reprezintă una dintre condiţiile necesare pentru a identifica un anumit mecanism al schimbării („cum se produce schimbarea, efectul?”), deoarece premisa acceptată este că modificările la nivelul variabilei mediatoare precedă temporal modificările de la nivelul variabilei dependente primare De pildă, într-un studiu ce urmăreşte eficienţa terapiei raţional-emotive în combaterea depresiei, în care se teoretizează că principalul mecanism al schimbării pentru reducerea simptomatologiei depresive vizează diminuarea cogniţiilor iraţionale autodepreciative, ar trebui introdusă cel puţin o evaluare intermediară, însă dezirabil ar fi să existe mai multe asemenea evaluări intermediare Aceasta ne-ar permite să observăm că, pe măsura implementării terapiei, apare mai întâi o diminuare a nivelului cogniţiilor iraţionale autodepreciative urmată de o reducere a simptomatologiei depresive şi că între cele două aspecte există o asociere semnificativă Astfel, în studiile focalizate pe mecanismele schimbării se apelează la evaluări intermediare (pe parcursul derulării intervenţiei), nu numai ale variabilelor dependente de interes, ci şi ale aspectelor psihologice care ar putea fi identificate drept mecanisme ale schimbării (care explică de ce este eficientă intervenţia şi cum poate fi optimizată aceasta) Alte detalii despre condiţiile necesare pentru a identifica mecanismele schimbării (variabilele mediatoare) responsabile pentru producerea efectului sunt prezentate în secţiunea Un alt aspect legat de evaluarea VD se referă la cutuma de a diferenţia, în cadrul studiilor randomizate controlate, între variabilele dependente principale (primary outcomes) şi variabilele dependente secundare De exemplu, într-un studiu care are drept scop implementarea unei intervenţii care să reducă nivelul de epuizare emoţională (burnout) printre angajaţi, nivelul de burnout reprezintă variabila dependentă primară Desigur, cu ocazia acestui studiu pot fi colectate şi alte date, cum ar fi nivelul productivităţii în muncă, satisfacţia legată de locul de muncă, implicarea în muncă etc ), însă acestea reprezintă aspecte colaterale care pot fi afectate de intervenţia implementată Variabila dependentă primară are rolul de a oferi răspunsul principal cu privire la testarea ipotezei („este intervenţia una eficientă pentru problema pentru care a fost dezvoltată?”), precum şi în luarea unor decizii cu impact metodologic cum ar fi stabilirea numărului de participanţi în studiu, în baza efectului estimat al intervenţiei asupra variabilei dependente principale În sfârşit, un ultim aspect de discutat, cu relevanţă pentru evaluarea impactului intervenţiei, are în vedere diferenţele existente între studiile cauzale şi cele pragmatice cu privire la alegerea variabilelor dependente măsurate Pentru a prezenta aceste diferenţe, vom distinge mai întâi între variabile dependente reale (true outcomes) şi variabile dependente surogat (surrogate outcomes) (Torgerson şi Torgerson, ) De pildă, în cazul unui program menit să reducă delincvenţa la adolescenţi, variabile dependente reale ar putea fi prezenţa sau absenţa unui comportament delincvent înregistrat la poliţie, prezenţa sau absenţa unei recidive, în timp ce variabile dependente surogat ar putea fi nivelul de agresivitate sau nivelul comportamentului antisocial măsurat prin scale de specialitate VD reale sunt cele vizate direct sau indirect de orice intervenţie, prin impactul lor la nivel social În schimb, VD surogat, deşi se află în strânsă legătură cu aspectele reale vizate şi deseori conduc la apariţia VD reale, nu oferă certitudinea apariţiei acestor efecte Spre exemplu, nu întotdeauna o satisfacţie maritală scăzută se soldează cu divorţ, nu întotdeauna eşecul de a reduce cogniţiile iraţionale asociate violenţei domestice se manifestă prin acte manifeste de violenţă domestică, nu întotdeauna reducerea densităţii oaselor se manifestă prin fracturi etc Tabelul Exemple de variabile dependente reale, respectiv surogat în domenii diverse Scopul intervenţiei VD surogat VD reală  Probleme în relaţia de cuplu satisfacţie maritală divorţ  Violenţa domestică reducere cogniţii iraţionale reducerea agresivităţilor raportate  Osteoporoza reducerea densităţii din oase fractură  Domeniul educaţional atitudinea faţă de şcoală abandon şcolar  Domeniul organizaţional epuizare emoţională procent fluctuaţie de personal  Infracţionalitatea nivelul de ostilitate/agresivitate comitere infracţiuni  Studiile pragmatice, prin caracteristica lor de a avea o validitate externă (ecologică) ridicată, prezintă un interes crescut pentru publicul larg şi pentru formatorii de politici De aceea, în cazul lor se recomandă să se utilizeze variabile dependente reale Acest lucru este posibil şi pentru că, în cazul acestui gen de studii (condiţii relaxate de eligibilitate/absenţa monitorizării integrităţii intervenţiei), pot fi colectate mai multe date (mai mulţi participanţi), care să asigure o putere statistică suficientă pentru a detecta mărimi ale efectelor mai scăzute, mai specifice cazului măsurării VD reale decât măsurării variabilelor-surogat În schimb, în studiile cauzale, deşi ar fi dezirabil să fie utilizate tot VD reale în calitate de VD principale, acest lucru deseori nu este posibil din raţiuni metodologice Prin condiţiile stricte impuse cu privire la selectarea participanţilor şi implementarea studiului este dificil să fie strâns un volum foarte mare de participanţi la studiu În plus, efectele oricărei intervenţii tind să fie mai ridicate ca mărime în cazul variabilelor-surogat decât a celor reale În consecinţă, pentru a evita probleme cauzate de o putere statistică mai scăzută (de genul erorii de tip II în testarea ipotezelor), se obişnuieşte ca VD principale într-un studiu cauzal să fie din categoria VD surogat, chiar dacă sunt colectate secundar şi măsuri ale VD reale Etapa de urmărire Scopul implicit al oricărei intervenţii este acela de a produce modificări în direcţia dorită care să reziste în timp, astfel încât efectele produse să nu fie doar unele tranzitorii De aceea, în sprijinul acestui scop nu este suficient doar să ne focalizăm asupra comparaţiei dintre grupe, efectuată cu ocazia evaluării postintervenţie (de la finalul etapei de derulare a intervenţiei), ci este nevoie să urmărim (follow-up) dacă diferenţele observate se menţin în timp, se accentuează sau se reduc sau chiar dispar, odată cu trecerea timpului Durata etapei de urmărire nu este una standard, însă majoritatea studiilor randomizate controlate apelează la o perioadă cuprinsă între şase luni şi doi ani Rolul cercetătorului în această secvenţă este în principal acela de a apela la măsuri care să asigure un nivel cât mai scăzut de pierdere a participanţilor, îndeosebi prin: (a) asigurarea accesului/disponibilităţii participanţilor pentru evaluări în perioada de urmărire; (b) verificarea măsurii în care în istoricul participantului nu au fost înregistrate evenimente care să afecteze validitatea concluziilor obţinute (de exemplu, verificarea faptului că participantul nu a apelat în perioada de urmărire la intervenţii/tratamente alternative pentru problematica vizată, nu a apelat la alţi specialişti pentru a continua să primească intervenţia alocată etc ) Pentru primul aspect, acela de a facilita accesul la participanţi în perioada de follow-up, câteva indicaţii utile (Shadish et al , ) ar fi: (a) colectarea datelor de contact nu numai de la participant, ci şi de la una sau două persoane apropiate acestuia, pentru a creşte şansa de a-l contacta ulterior, în cazul în care datele sale de contact nu mai sunt valabile; (b) menţinerea contactului cu participanţii prin scurte informări telefonice (scrise), pentru a obţine reconfirmarea de la participant cu privire la disponibilitatea sa de a fi evaluat ulterior, îndeosebi în perioada premergătoare evaluării (de exemplu, cu o săptămână înainte); în plus, preferabil ar fi dacă comunicarea ar fi făcută de către acelaşi asistent de cercetare cu care participantul a interacţionat pe parcursul evaluărilor anterioare; (c) flexibilitate cu privire la locaţia în care are loc evaluarea (deplasare la sediul participantului) şi/sau oferirea de stimulente (plata transportului, recompensare financiară pentru şedinţa de evaluare); (d) mici gesturi de atenţie (de exemplu, trimiterea unei felicitări cu ocazia zilei de naştere a participantului); (e) oferirea unei broşuri cu informaţii utile (calendarul evaluărilor în perioada de follow-up; menţionarea stimulentelor financiare oferite, dacă este cazul, pentru evaluările din perioada de urmărire; precizarea datelor de contact unde participantul ar trebui să anunţe dacă apar modificări în datele sale de contact etc ) În ceea ce priveşte cel de-al doilea aspect care conduce la pierderea participanţilor, acela de contaminare a intervenţiei alocate (de exemplu, persoane care au urmat intervenţia X în etapa de derulare a acesteia, dar care apelează la intervenţia alternativă Y în perioada de urmărire), se pot activa câteva strategii de reducere a acestui risc Una dintre acestea constă în oferirea posibilităţii participantului de a apela la câteva (două sau trei) şedinţe suplimentare din intervenţia alocată (boosting sessions) De exemplu, în cazul intervenţiilor din zona psihoterapiei este acceptabil să li se ofere două-trei şedinţe suplimentare într-un interval de şase luni, pe care participanţii să le planifice în perioada de urmărire, doar dacă au neapărat nevoie de ele O altă posibilitate existentă, fezabilă în anumite cazuri (în funcţie de problema şi aspectele etice implicate), este aceea de a include participantul pe o listă de aşteptare şi de a-i oferi ulterior intervenţia promisă, după finalizarea perioadei de urmărire Desigur, o măsură obligatorie în legătură cu problema contaminării intervenţiei, este aceea de a intervieva participanţii (de exemplu, telefonic, cu ocazia pregătirii şedinţelor de evaluare derulate în perioada de urmărire) pentru a vedea în ce măsură ei au apelat pe cont propriu la continuarea intervenţiei respective sau la alte metode de intervenţie concurente (alternative) Asemenea situaţii îl scot pe participant din faza de urmărire deoarece primeşte în continuare un tratament activ Tot cu ocazia acestui interviu pot fi evidenţiate evenimente importante apărute în istoricul individului, care ar putea afecta evoluţia sa (prin diminuarea sau accentuarea problemei avute) Etapa de analiză Din punct de vedere logistic, aceasta reprezintă cea mai uşoară şi scurtă etapă din cadrul unui studiu randomizat controlat Din raţiuni pedagogice, vom diviza această etapă în trei elemente distincte: (a) analiza standard; (b) analiza la nivelului intenţiei de a interveni (intent to treat); (c) alte analize relevante Analiza standard În cadrul acestei analize se testează ipotezele cercetării, un rol principal revenindu-i ipotezei care vizează efectul intervenţiei asupra VD primare Din acest punct de vedere, cele mai importante analize sunt comparaţiile dintre grupe realizate la momentul postintervenţiei, precum şi în perioada de follow-up Comparaţia de la nivelul postintervenţiei ne arată dacă intervenţia propusă a avut un efect (este mai eficientă decât o intervenţie alternativă etc ), în timp ce comparaţiile la nivel de follow-up ne indică dacă efectul este unul durabil În cazul analizei standard sunt relevante (vezi nota , p ) şi analizele intragrupale (de exemplu, pentru a analiza dacă există modificări semnificative ale VD între pretest şi posttest în cadrul grupului experimental) Tot în cadrul analizei standard are loc şi analiza de verificare a echivalenţei grupelor incluse în studiu la nivel de pretest (preintervenţie) Dacă echivalenţa asumată în baza alocării randomizate este susţinută (dublată) empiric prin compararea evaluărilor efectuate la momentul preintervenţiei, datele de la nivel de postintervenţie şi follow-up pot fi analizate simplu, prin apelul la testul t student sau tehnicile ANOVA, în funcţie de caz Dacă echivalenţa la nivel de preintervenţie nu este sprijinită empiric (există diferenţe între grupele comparate, în ciuda alocării randomizate), aceste diferenţe pot fi tratate drept covariabile sau pot fi incluse în analizele statistice standard ale diferenţelor observate între pretest şi posttest (gain scores) Desigur aceste aspecte sunt valabile atât pentru studiile cauzale, cât şi pentru cele pragmatice, în contextul în care obiectivul studiului se rezumă la identificarea unei relaţii de tip cauză-efect Dacă obiectivele studiului vizează identificarea mecanismelor schimbării, designul şi analiza standard se complică (vezi detalii în secţiunea ) Analiza la nivelul intenţiei de a interveni Spre deosebire de cazul ideal, în realitate între numărul participanţilor imediat după momentul alocării lor randomizate în grupele experimentale şi numărul participanţilor la finalul perioadei de urmărire pot exista diferenţe mari Acest lucru se întâmplă pentru că unii participanţi refuză să urmeze intervenţia alocată, deşi iniţial şi-au dat acordul pentru aceasta, alţii renunţă pe parcursul derulării intervenţiei (nu finalizează programul convenit), iar alţii sunt pierduţi pe parcursul duratei de follow-up fie din cauza apariţiei contaminării intervenţiei, fie din cauza absenţei măsurătorilor din perioada de urmărire (participanţi care refuză să fie evaluaţi repetat sau participanţi ale căror date de contact nu mai sunt valabile şi care nu mai pot fi reperaţi prin mijloace alternative de căutare) În urma acestei situaţii este posibil ca uneori doar - % dintre participanţii alocaţi iniţial într-un anumit grup experimental să poată fi evaluaţi până la final pentru a surprinde efectele intervenţiei Din acest punct de vedere, este important să se identifice motivul pentru care participantul a fost pierdut pentru analiză: (a) din cauza intervenţiei în sine (treatment attrition) (participantul renunţă pentru că ar fi preferat o altă intervenţie, nu o găseşte suficient de interesantă pentru a continua pe cea alocată, resimte efecte secundare negative etc ); (b) din motive obiective ale participantului (se mută într-o altă localitate, apariţia unor evenimente cu impact în viaţa sa); (c) din motive obiective tehnice (diminuarea finanţării, însoţită de o reducere a numărului de participanţi; defecţiuni în salvarea unor date pe calculator etc ) Dacă persoanele incluse în punctele b şi c pot fi excluse din analiză pe anumite secvenţe (acolo unde lipsesc datele) fără a afecta validitatea concluziilor, excluderea participanţilor care au renunţat la studiu din motivele invocate la punctul a poate conduce la rezultate distorsionate Să ne imaginăm că am fi dorit să evaluăm în ce măsură studenţilor le-ar plăcea să studieze metodologia cercetării printr-o strategie didactică alternativă Să presupunem că am fi inclus iniţial de persoane, dar că pe parcurs dintre ele au renunţat pentru că se plictiseau sau nu înţelegeau prelegerile, iar alte au renunţat în favoarea unei alte metode de predare pe care o găseau mai atractivă Dacă noi am analiza, în acest caz, datele colectate doar de la cei de participanţi rămaşi în sală până la final cu siguranţă am obţine scoruri distorsionate, mult mai favorabile intervenţiei propuse decât dacă am fi colectat datele de la toţi cei de participanţi iniţiali Pentru a preîntâmpina asemenea distorsiuni, în cazurile în care se înregistrează un procent mai mare de - % de renunţare din cauza incompatibilităţii cu intervenţia sau în care se constată diferenţe în rata de renunţare între grupul experimental (de exemplu, %) şi cel de control (de exemplu, %), se apelează complementar la analiza statistică la nivelul intenţiei de a interveni în defavoarea analizei standard, în plus faţă de analiza standard Astfel, vom putea compara impactul pe care îl are fenomenul de pierdere a participanţilor cauzat din alte motive decât cele obiective şi în ce măsură afectează el concluziile studiului Soluţia uzuală în analiza de acest tip presupune luarea în considerare a ultimelor scoruri disponibile, inclusiv de la participanţii care au renunţat să primească intervenţia din dorinţa lor De exemplu, dacă există date înregistrate doar la nivel de preintervenţie, se va asuma că aceste valori vor fi obţinute şi în testările ulterioare Dacă participantul a fost evaluat iniţial (pretest), dar a participat la o parte dintre şedinţe, fiind evaluat intermediar în două momente (de exemplu, după şedinţa şi după şedinţa ), însă nu există rezultate cu privire la performanţa lui măsurată la momentul postintervenţiei, se va trece în locul datelor lipsă scorul înregistrat la ultima evaluare intermediară pentru care există date (şedinţa ) etc O strategie alternativă mai bună, însă cu sorţi mai mici de izbândă, ar fi aceea de a solicita, inclusiv celor care au renunţat la intervenţia alocată din motive de incompatibilitate cu aceasta, să participe la evaluările periodice (fie ele intermediare, postintervenţie sau din perioada de urmărire) Aceste rezultate ar reprezenta mai bine situaţia reală decât asumarea păstrării constante a rezultatelor obţinute cu ocazia ultimei evaluări disponibile Desigur, cel mai probabil, ar fi nevoie de oferirea de stimulente pentru a-i determina pe cei care au renunţat la studiu din motive de incompatibilitate cu intervenţia alocată, să rămână participanţi activi în studiu, pentru această secvenţă de evaluare În sfârşit, un alt aspect important de urmărit, indiferent de procentul participanţilor care s-au retras din studiu, este analiza caracteristicilor participanţilor care s-au retras din studiu De interes sunt atât caracteristicile lor demografice, cât mai ales unele variabile de interes (factori de risc, nivelul VD principale la pretest etc ), pentru a vedea care segment de participanţi este mai vulnerabil de a renunţa la tipul de intervenţie alocată Alte analize relevante Cel puţin în domeniul psihologiei clinice, unde nivelul de rigurozitate asociat studiilor randomizate controlate este unul extrem de ridicat ca urmare a modelului preluat din ştiinţele medicale, se recomandă analize suplimentare celor care vizează direct evaluarea variabilelor dependente, a celor mediatoare sau moderatoare În această direcţie se recomandă a se diferenţia între efectul/impactul factorilor comuni, nespecifici formei de intervenţie analizată (cum ar fi alianţa terapeutică, gradul de aderenţă la protocolul intervenţiei, complianţa clienţilor), de impactul factorilor specifici intervenţiei respective De exemplu, în cazul aderării la protocolul intervenţiei, se observă măsura în care activităţile sunt conforme cu cele precizate în protocolul intervenţiei în cadrul unui eşantion de şedinţe din cele efectuate, pentru a oferi siguranţă suplimentară pentru validitatea de construct a rezultatelor De asemenea, se poate diferenţia efectul specific al intervenţiei după controlarea variaţiilor în nivelul VD determinate de factorii psihoterapeutici nespecifici (relaţionarea şi încrederea în psihoterapeut, implementarea intervenţiei în acord cu recomandările pentru aceasta, complianţa clienţilor la tratament etc ) În această direcţie au fost dezvoltate o serie de scale care să măsoare aceste aspecte nespecifice, ce pot fi evaluate şi supuse analizei statistice în mod suplimentar faţă de aspectele directe urmărite Un alt aspect relevant este conceptul de semnificaţie clinică (care ar putea fi extins către alte domenii de interes sub numele de semnificaţie sau relevanţă practică) La ce se referă acest lucru? Obţinerea unei diferenţe semnificative statistic între două grupe comparate (de exemplu, între un grup care a primit o intervenţie menită să reducă nivelul agresivităţii şi un grup de control de tipul listei de aşteptare) nu înseamnă automat că intervenţia este deosebit de benefică din punct de vedere practic E posibil, de exemplu, ca nivelul de agresivitate în grupul experimental să fi scăzut ca frecvenţă de apariţie, dar din punct de vedere practic nu prea are relevanţă dacă cineva apelează la un limbaj agresiv cu o frecvenţă de ori pe oră sau cu o frecvenţă de ori pe oră În mod similar, dacă nivelul de depresie în urma unei intervenţii se modifică de la la puncte (măsurate cu ajutorul scalei Beck), individul suferă în continuare de un nivel moderat de depresie, chiar dacă diferenţa de două puncte replicată la nivelul celor două grupe ar însemna o diferenţă semnificativă statistic De aceea, pe lângă observarea unei diferenţe între grupele comparate reflectate printr-un rezultat semnificativ statistic (p X O O C â‰¤ O Acest tip de design se distinge de celelalte forme de studii cvasiexperimentale nu prin format (de exemplu, poate fi un design cu grup de control, cu evaluări pre- şi posttest), ci prin specificul împărţirii participanţilor în grupul experimental, respectiv în cel de control (în baza rezultatelor observate la pretest, mai exact a unui scor-limită [cutoff score]) Scorul de la pretest utilizat pentru divizare poate fi cel obţinut la VD, de la o altă variabilă, fie ea corelată sau nu cu VD sau poate fi chiar un scor compozit prin reunirea mai multor variabile Un exemplu de acest tip de design este oferit în caseta Avantaje În ciuda lipsei de inspiraţie în denumirea acestui design, acesta este considerat a fi cel mai puternic tip de design cvasiexperimental, fiind considerat de mulţi (Shadish et al , ) la fel de eficient ca şi studiile experimentale în identificarea unei relaţii de tip cauză-efect, deşi nu apelează la randomizare ca modalitate de control a diferitelor variabile confundate Este recomandat de specialişti (Torgerson şi Torgerson, ) spre a fi utilizat ori de câte ori nu este etic posibil să se apeleze la randomizare (studii experimentale) Riscuri Puterea statistică scăzută Pentru a ajunge la aceeaşi putere statistică pe care o posedă un studiu de tip experimental, este nevoie de colectarea datelor de la un număr dublu sau chiar triplu de participanţi pentru a atinge aceeaşi putere statistică Numărul de participanţi necesari poate fi chiar de - ori mai mare decât într-un studiu experimental, pe măsură ce scorul limită ales este mai îndepărtat faţă de medie/mediana variabilei respective, pe măsură ce variabila de grupare corelează mai mult cu VD Artefacte ce induc erori suplimentare Cunoaşterea publică a scorului-limită utilizat în decizia de a include participantul în grupul experimental sau în cel de control poate spori riscul unor evaluări subiective (o indulgenţă sau exigenţă sporită în evaluarea nivelului variabilei utilizate pentru a grupa indivizii) Aceeaşi problemă există şi în cazul alegerii unor scoruri limită care conduc natural la consecinţe diferite (de exemplu, utilizarea notei ca standard minim pentru a promova un examen este asociată adesea cu situaţia în care mai mulţi indivizi obţin o asemenea notă decât una mai mică, incluzând aici cazurile în care profesorii acordă „din milă” o asemenea notă, inclusiv unora care nu îndeplineau criteriile minime pentru promovare) De aceea, indicat ar fi ca scorul-limită ales să nu fie identic cu anumite criterii oficiale care să conducă la consecinţe diferite (recompense vs penalizări)  Caseta O ilustrare a unui design cu linie întreruptă de regresie O asociaţie caritabilă organizează anual meditaţii gratuite pentru elevii ce provin din familii defavorizate cu scopul de a-i ajuta să promoveze bacalaureatul Statul român se gândeşte să subvenţioneze % din cheltuielile asociaţiei legate de acest proiect dacă se dovedeşte că programul este unul eficient (îmbunătăţeşte performanţa academică a elevilor) Asociaţia caritabilă este de acord cu această propunere, însă sugerează că eficienţa programului de meditaţii ar trebui demonstrată altfel decât printr-un studiu experimental, deoarece ar fi lipsit de etică ca, în baza randomizării, o parte dintre tinerii aflaţi în grupul său ţintă (tinerii proveniţi din familii defavorizate) să nu beneficieze de această pregătire suplimentară pentru simplul fapt că au fost distribuiţi aleatoriu în grupul de control De aceea, ei îşi propun să demonstreze eficienţa programului prin intermediul unui design cu regresie întreruptă Pentru aceasta, în locul procedurii de randomizare, ei decid să împartă elevii în cele două grupe (experimentală şi de control) în baza unui criteriu ce vizează severitatea dificultăţilor materiale cu care se confruntă familiile elevilor (în ideea că cei mai nevoiaşi să beneficieze obligatoriu de acest program) Astfel, toţi elevii al căror venit net per membru de familie se situează sub de euro/lună au fost cuprinşi în grupul experimental, iar cei care aveau un venit mediu per membru de familie peste de euro/lună, dar sub media naţională erau cuprinşi în grupul de control Astfel, suma de de euro venit lunar/membru familie a reprezentat scorul-limită în baza căruia au fost constituite cele două grupe – experimentală şi de control (venitul fiind variabila de grupare) Conform acestui algoritm de împărţire au fost distribuiţi de elevi în grupul experimental, respectiv de elevi în grupul de control Cei din grupul experimental au urmat şedinţe săptămânale de meditaţie timp de trei luni, în timp ce participanţii din grupul de control nu au urmat şedinţe de meditaţie nici în acest cadru organizat, nici prin intermediul altor programe sau demersuri individuale, bazându-se în pregătirea lor doar pe informaţiile învăţate la şcoală (pentru că resursele lor materiale nu permiteau apelul la strategii alternative, iar această stare de fapt a fost verificată ulterior în baza unui interviu) Variabila dependentă urmărită a constat în media generală obţinută la bacalaureat, fiind vorba de un punctaj cu valori între şi Concluzii În acest capitol au fost cuprinse informaţii introductive despre principalele modalităţi de studiu ştiinţific a unei relaţii de tip cauză-efect Experimentul rămâne calea regală de studiu a aspectelor psihologice, datorită caracteristicilor sale care îi permit să controleze cât mai mulţi factori străini (variabile confundate) şi să evite distorsiuni ce pot afecta concluziile studiilor Din acest punct de vedere, studiile experimentale ar trebui să constituie prima linie de atac în abordarea ştiinţifică a oricărei probleme psihologice care a depăşit faza studiilor efectuate în scop explorator sau descriptiv Cea mai mare parte a capitolului este destinată prezentării diferitelor tipuri de experimente, cu accent pe un tip particular de design specific intervenţiilor, denumit generic studiu randomizat controlat Cu toate că cel mai răspândit tip de randomizare are loc la nivel individual, o alternativă posibilă este randomizarea la nivel de cluster Dată fiind importanţa acestei categorii de studii, am prezentat pe parcursul capitolului o serie de recomandări practice legate de implementarea unui studiu randomizat controlat, care vizează: recrutarea participanţilor la studiu, caracteristicile formularului de consimţire, implementarea studiului, etapa de urmărire şi analiza datelor (atât pentru a surprinde o relaţie de tip cauză-efect, cât şi pentru a identifica potenţiale mecanisme psihologice responsabile pentru schimbarea produsă) Atunci când randomizarea nu este posibilă nici la nivel individual, nici la nivel de cluster, fie din motive etice, fie din motive ce ţin de fezabilitatea implementării, recomandăm utilizarea unei strategii alternative, aceea de a implementa studii de tip cvasiexperimental Acestea împărtăşesc cu studiile experimentale ideea manipulării variabilei independente (intervenţiei) de către cercetător pentru a vedea efectele acestei acţiuni asupra variabilei dependente, însă prezintă mai multe riscuri cu privire la validitatea internă a concluziilor extrase din cauza absenţei randomizării participanţilor în grupele experimentale, măsură care ar fi asigurat (cel puţin la nivel teoretic) un control al variabilelor confundate Din multitudinea de designuri cvasiexperimentale sunt prezentate câteva dintre cele mai populare Între acestea se distinge designul cu linie de regresie întreruptă, considerat a fi cel mai puţin afectat de riscuri la nivelul validităţii interne a studiului dintre designurile de tip cvasiexperimental Lecturi suplimentare I Boutron, D Moher, D G Altman, K Schulz, P Ravaud, for the CONSORT group ( ) Methods and processes of the CONSORT group: Example of an extension for trials assessing nonpharmacologic treatments Annals of Internal Medicine, , pp - Sistemul CONSORT este probabil cel mai avansat model de raportare a studiilor experimentale, fiind menţionaţi şi explicaţi paşii necesari de urmat pentru redactarea unor articole de calitate fundamentate pe studii randomizate În articolul menţionat accentul este pus pe o anumită categorie de intervenţii (cele nefarmaceutice), aplicabile cazurilor specifice din psihologie sau psihoterapie Sandra Eldridge, Sally Kerry ( ) A Practical Guide to Cluster Randomised Trials in Health Services Research Chichester, UK: Willey & Blackwell Cititorii interesaţi să aprofundeze/implementeze studii randomizate controlate la nivel de cluster vor găsi aici un ghid aplicativ relevant, cu toate că exemplele oferite provin exclusiv din sfera sănătăţii Alan E Kazdin ( ) Mediators and mechanisms of change in psychotherapy research Annual Review of Clinical Psychology, , pp - Articolul discută exigenţele metodologice şi statistice pentru a identifica mecanisme ale schimbării (variabile mediatoare), responsabile pentru modificările observate la nivelul variabilei dependente în urma apelului la psihoterapie Deşi exemplele se rezumă la sfera psihologiei clinice, logica prezentată poate fi extinsă către alte tipuri de intervenţie, fie ele din mediul organizaţional sau educaţional Sebastian Pintea ( ) The relevance of results in clinical research: statistical, practical, and clinical significance Journal of Cognitive and Behavioral Psychotherapies, ( ), pp - , disponibil şi online la http://www scipio ro/documents/ / c - b- d f-aaec-dee f Articolul detaliază, pentru cei interesaţi, indicatorii de calcul ai eficienţei unei intervenţii din perspectivă clinică (client recuperat, ameliorat etc ) Aceste inovaţii nu sunt echivalente conceptului standard de mărime a efectului, chiar dacă sunt dependente indirect de acesta, fiind utile îndeosebi din perspectivă aplicativă, în comunicarea cu beneficiarii serviciilor sau cu cei care decid finanţarea din bani publici a unor asemenea servicii William R Shadish, Thomas D Cook, Donald T Campbell ( ) Experimental and quasi-experimental designs for generalized causal inference Boston, USA: Houghton Mifflin Company Dacă ar fi să nominalizez o singură carte însoţitoare a capitolului de faţă, cu o serie de texte extensive despre problematica experimentelor şi cvasiexperimentelor, atunci aceasta ar fi nominalizarea făcută Cartea prezintă în detaliu avantajele şi riscurile existente pentru diferite designuri experimentale şi cvasiexperimentale discutate în acest capitol William Trochim ( ) Regression-discontinuity design in health evaluation În L Sechrest, E Perrin şi J Bunker (eds ) Research Methodology: Strengthening Causal Interpretations of Nonexperimental Data U S Dept of HHS, Agency for Health Care Policy and Research, Washington, D C Disponibil online, alături de alte articole pe aceeaşi temă, la: http://www socialresearchmethods net/research/rd htm Articolul respectiv oferă o introducere detaliată asupra caracteristicilor unui design cu linie de regresie întreruptă, inclusiv cu referire la paşii caracteristici de urmat în analiza statistică a datelor provenite dintr-un asemenea design Bibliografie Barlow, D H , Nock, M K , Hersen, M ( ) Single case experimental designs: Strategies for studying behavior change (ediţia a III-a) Boston: Allyn & Bacon Baron, R M , Kenny, D A ( ) The moderator-mediator variable distinction in social psychological research: Conceptual, strategic, and statistical considerations Journal of Personality and Social Psychology, , pp - Bjelakovic, G , Nikolova, D , Gluud, L L et al ( ) Mortality in randomized trials of antioxidant supplements for primary and secondary prevention: systematic review and metaanalysis Journal of the American Medical Association, , pp - Bradt, J , Dileo, C ( ) Music for stress and anxiety reduction in coronary heart disease patients Cochrane Database of Systematic Reviews, , CD Cordray, D S Pion, G M ( ) Treatment strength and integrity: Models and methods În R R Bootzin P E McKnight (eds ), Strengthening research methodology: Psychological measurement and evaluation (pp - ) Washington, DC: American Psychological Association Donner, A Klar, N ( ) Design and analysis of cluster randomization trials in health research Londra: Arnold Elmes, D G , Kantowitz, B H , Roediger III, H L ( ) Research Methods in Psychology (ediţia a IX-a) Wadsworth/Thomson Learning, Inc Gherman, G ( ) Impactul muzicii asupra anxietăţii post-operatorii la pacienţii cu intervenţii de stentare Lucrarea de licenţă la Universitatea de Vest din Timişoara Manuscris nepublicat Hofmann, W , De Houwer, J , Perugini, M , Baeyens, F , Crombez, G ( ) Evaluative conditioning in humans: A metaanalysis Psychological Bulletin, , pp - Kazdin, A E ( ) Arbitrary metrics: Implications for identifying evidence based treatments American Psychologist, ( ), pp - Kazdin, A E ( ) Mediators and mechanisms of change in psychotherapy research Annual Review of Clinical Psychology, , pp - Kazdin, A E ( ) Single-case Research Designs: Methods for Clinical and Applied Settings (ediţia a II-a) New York: Oxford University Press Klassen, J A , Liang, Y , Tjosvold, L , Klassen, R P , Hartling, L ( ) Music for pain and anxiety in children undergoing medical procedures: A systematic review of randomized controlled trials Ambulatory Pediatrics, ( ), pp - Lando, H A ( ) A factorial analysis of preparation, aversion, and maintenance in the elimination of smoking Addictive Behaviors, , pp - Lilienfeld, S O , Lynn, S J , Ruscio, J , Beyerstein, B L ( ) great myths of popular psychology: Shattering widespread misconceptions about human behavior Chichester, Anglia: Wiley-Blackwell McDonald, A M , Knight, R C , Campbell, M K , Entwistle, V A , Grant, A M et al ( ) What influences recruitment to randomised controlled trials? A review of trials funded by two UK funding agencies Trials, , p MCHP (Minitoba Centre for Health Policy) ( ) Propensity score matching in observational studies Găsit la: http://umanitoba ca/faculties/medicine/units/mchp/protocol/media/propensity score matching pdf Moher D , Hopewell, S , Schulz, K F , Montori, V , Gotzsche, P C , Devereaux, P J , Elbourne, D , Egger, M , Altman, D G ( ) CONSORT Explanation and Elaboration: updated guidelines for reporting parallel group randomised trials British Medical Journal, , pp - Murray, D M ( ) Design and analysis of group-randomized trials New York: Oxford University Press Urbaniak, G C , Plous, S ( ) Research Randomizer (Version ) [Computer software] Găsit la: August , http://www randomizer org/ Pelham, B W , Blanton, H ( ) Conducting research in psychology: Measuring the weight of smoke (ediţia a III-a) Belmont, CA: Wadsworth/Thomson Pfister, M , Jones S J , Cheek, D ( ) Music Therapy for Preoperative Anxiety Găsit la: http://www crna tcu edu/docs/dnp-a% capstone/Pfister% M% Use% of% Music% to% Minimize% Preoperative% Patient% Anxiety% pdf Piaggio, G , Elbourne, D R , Altman, D G , Pocock, S J , Evans, S J ( ) Reporting of noninferiority and equivalence randomized trials: an extension of the CONSORT statement Journal of the American Medical Association, , pp - Pietschnig, J , Voracek, M , Formann, A K ( ) Mozart effect – Shmozart effect: A metaanalysis Intelligence, , pp - Pintea S ( ) The relevance of results in clinical research: statistical, practical and clinical significance Journal of Cognitive and Behavioral Psychotherapies, ( ), pp - Rauscher, F H , Shaw, G L , Ky, K N ( ) Music and spatial task performance Nature, , p Riegelman, R ( ) Contributory cause: unnecessary and insufficient Postgraduate Medicine, , pp - Sava, F A , Rusu, S ( ) Evaluarea personalităţii prin tehnica amorsării În F A Sava (ed ), Metode implicite de investigare a personalităţii (pp - ) Iaşi: Editura Polirom Schulz, K F , Altman, D G , Moher, D ( ) CONSORT Statement: Updated guidelines for reporting parallel group randomised trials Annals of Internal Medicine, ( ), pp - Shadish, W R , Cook, T D , Campbell, D T ( ) Experimental and Quasi-Experimental Designs for Generalized Causal Inference Boston: Houghton-Mifflin Singer, J D , Willett, J B ( ) Applied Longitudinal Data Analysis: Methods for Studying Change and Event Occurrence New York: Oxford University Press Torgerson, D Torgerson, C ( ) Designing and running randomised trials in health, education and the social sciences Basingstoke: Palgrave Macmillan În limba engleză se regăseşte sub denumirea de carry-over effect Acest tip de efect constituie un risc atunci când nu se urmăreşte explicit măsurarea acestui efect Dacă se are în vedere surprinderea sau accentuarea acestui efect, precum în cazul tehnicilor de amorsare (vezi Sava şi Rusu, ), atunci efectul nu constituie un risc, ci dimpotrivă constituie elementul activ căutat prin manipularea experimentală Studiile care vizează obiective cauzal-explicative sunt focalizate pe identificarea mecanismelor schimbării (de exemplu, a factorilor responsabili pentru eficienţa unui anumit tip de psihoterapie în diminuarea anxietăţii sociale) Aceste mecanisme joacă rolul unor variabile mediatoare între VI şi VD, contribuind la producerea unui lanţ cauzal (VI modifică mecanismul schimbării, iar acesta, la rândul lui, modifică nivelul VD) În literatura de specialitate sunt mai multe riscuri privitoare la validitatea internă a acestui tip de design, o parte dintre acestea, precum efectul maturării, reactivitatea măsurării, istoricul, expectanţele experimentatorului (Shadish et al , ) au fost prezentate în detaliu în capitolul anterior (în secţiunile dedicate validităţii interne şi celei de construct) Unii cercetători definesc aceste tipuri de distorsiuni drept artefacte În opinia noastră, ele reprezintă mai degrabă variabile confundate deoarece pot afecta validitatea internă a unui studiu, putând fi percepute ca nişte artefacte doar dacă consecinţele lor vizează afectarea altor tipuri de validitate (externă, de construct) şi dacă influenţa lor a fost una relativ constantă asupra tuturor celor investigaţi Shadish, Cook şi Campbell ( ) oferă sintaxa de lucru în SPSS, precum şi un macro de lucru în Excel pentru randomizare simplă O altă resursă utilă ar fi accesarea de programe de randomizare disponibile online precum resursa pusă la dispoziţie de Urbaniak şi Plous (www randomizer org) Aceste resurse sunt utile pentru cazul în care alocarea randomizată se face simultan, însă pot fi adaptate şi pentru alocarea randomizată secvenţială De exemplu, în cazul psihoterapiei, participanţii într-un grup de control urmează acelaşi număr de şedinţe de psihoterapie, precum cei din grupul experimental În aceste întâlniri ei discută într-o manieră nespecifică (ca într-o discuţie amicală), despre problema lor, potenţiale cauze ale acesteia, despre alte aspecte din viaţa lor şi despre posibile soluţii, însă fără a apela la strategiile specifice alocate grupului experimental Situaţiile prezentate în tabelul prezintă doar cazurile simple, ale comparării a două grupe În cazul studiilor experimentale bazate pe compararea a mai mult de două grupe, pot fi găsite variante combinate De pildă, într-un studiu bazat pe trei grupe experimentale: (a) intervenţii cognitiv-comportamentale; (b) intervenţii familial-sistemice şi (c) intervenţie uzuală, vom putea urmări ca obiective atât să comparăm care dintre cele două forme de psihoterapie este mai eficientă, cât şi să vedem dacă efectul se datorează unor factori specifici acestor terapii, prin raportarea rezultatelor fiecărui tip de terapie la intervenţia uzuală (nespecifică) De asemenea, designurile pot fi complicate prin introducerea sau luarea în calcul a unor variabile moderatoare sau mediatoare Acest tip de studii este cunoscut şi sub denumirile de trialuri clinice, studii randomizate, studii randomizate clinice, denumiri care fac referire la sfera lor de aplicare cel mai frecvent întâlnită (medicină, farmacie, psihoterapie etc ; RCT – randomized clinical trial, clinical trial, randomized trial) Între RCT şi studii clinice controlate se face uneori o distincţie fină, în sensul că ultimele nu presupun randomizarea participanţilor în condiţiile experimentale, fiind astfel incluse în zona studiilor cvasiexperimentale Această nuanţă nu este însă utilizată în acest mod de către toţi autorii, unii dintre ei utilizând terminologia de studii clinice controlate pentru a se referi tot la un RCT Ar fi fost recomandat să se expliciteze succint ce resurse ar solicita includerea în grupul care beneficiază în plus de o intervenţie psihologică, cum ar fi numărul total de şedinţe sau frecvenţa acestora Termeni similari din literatura de specialitate care fac referire la livrarea acurată a intervenţiei sunt „integritatea” sau „fidelitatea intervenţiei” (treatment integrity sau treatment fidelity) (Cordray şi Pion, ) O măsură întâlnită în alte studii experimentale decât cele focalizate pe intervenţii (de exemplu, în cazul manipulării instructajului oferit participanţilor sau a intensităţii stimulilor prezentaţi etc ) este de a testa existenţa efectului indus prin manipularea experimentală (manipulation check) Acest procedeu a fost descris în capitolul anterior, când ne-am referit la aspecte ale validităţii de construct legate de manipularea VI Din perspectiva validităţii de construct, atât verificarea integrităţii intervenţiei, cât şi verificarea existenţei efectului indus prin manipulare, ne ajută să interpretăm corect rezultatele, din perspectiva implementării adecvate a VI Carroll et al ( apud Cordray şi Pion, ) au evidenţiat că un procent cuprins între % şi % dintre participanţii incluşi în studii randomizate au apelat, timp de cel puţin o şedinţă, la alte servicii (intervenţii) decât cele care le-au fost alocate în studiu Logica unui experiment spune că, în urma alocării randomizate a indivizilor în condiţiile experimentale, există o probabilitate foarte mică ca grupele comparate să difere la momentul pretestului, astfel că diferenţele observate la momentul postintervenţiei sunt considerate ca fiind cauzate prin manipularea VI (de intervenţie) O excepţie de la această situaţie este aceea în care grupul experimental îşi modifica nivelul VD din pretest în posttest în direcţia dezirabilă, dar nesemnificativ statistic dacă comparăm magnitudinea schimbării VD din pretest în posttest, iar grupul de control îşi modifica VD din pretest în posttest în direcţia opusă, dar tot la un nivel nesemnificativ statistic Este însă posibil ca analiza de la nivel de postintervenţie să indice diferenţe semnificative dintre grupuri Dacă ne vom baza numai pe comparaţia intergrupală de la momentul postintervenţiei, vom afirma că intervenţia este eficientă, deşi, practic, modificarea VD din grupul experimental nu a fost una semnificativă statistic Această problemă, rară în studiile experimentale, poate apărea frecvent în studiile cvasiexperimentale (în care nu este asigurată echivalenţa grupelor la nivel de VD în pretest), în cazul cărora analiza atât la nivel intergrupal, cât şi intragrupal, devine obligatorie Mai mult, în studiile cvasiexperimentale se poate ajunge uneori la concluzia că o intervenţie este eficientă chiar dacă nu există diferenţe semnificative statistic la nivel de postintervenţie De exemplu, într-un studiu în care se testează eficienţa unei noi metode de predare a statisticii la studenţi, se poate ajunge la concluzia că metoda este eficientă, chiar dacă ambele grupe înregistrează la posttest o medie a performanţelor în statistică egală cu , , în condiţiile în care cei care au avut parte de noua metodă de predare aveau la pretest media , , în timp ce grupul de control, expus unei metode tradiţionale de predare, avea la pretest aceeaşi medie ca şi la posttest, adică , Din perspectiva relaţiilor de mediere în explicitarea unor mecanisme cauzale se vorbeşte despre efecte directe (VM asupra VD) şi efecte indirecte (VI asupra VD) În terminologia unor relaţii de tip cauză-efect, putem vorbi despre cauze proximale (VM pentru VD), respectiv despre cauze distale (VI asupra VD), asumând că lanţul cauzal analizat are doar trei elemente (nu există un şir de variabile mediatoare între VI şi VD) O alternativă interesantă pentru testarea unor relaţii cauzale atunci când studiile randomizate la nivel individual sau la nivel de cluster nu sunt fezabile din punct de vedere logistic este experimentul derulat pe un singur subiect (single-case experiment) În domeniul psihologiei clinice, efectuarea unei serii considerabile de experimente pe un singur subiect poate constitui o dovadă mai puternică din perspectiva validării ştiinţifice a intervenţiei respective decât cea obţinută dintr-un singur studiu de tip cvasiexperimental Detalii suplimentare despre designul şi analiza experimentelor cu un singur subiect sunt oferite de Barlow, Nock şi Hersen ( ) X – intervenţie; O , O – observaţii (evaluarea efectelor) În studiile experimentale şi cele cvasiexperimentale clasice suntem interesaţi să găsim diferenţe semnificative între mediile celor două grupe pentru a considera intervenţia ca fiind eficientă În schimb, în designul liniei de regresie întrerupte se urmăreşte dacă linia de regresie dintre variabila cu rol de grupare şi VD are caracteristici diferite la nivel de intercept şi pantă de regresie (linie discontinuă în jurul valorii scorului-limită), inclusiv între indivizii similari – cei incluşi în grupul de control (cu un venit mediu de euro/lună) sau alocaţi în grupul experimental (cu un venit mediu lunar foarte apropiat de de euro lunar net/membru de familie) Capitolul Studiile non-experimentale Una dintre afirmaţiile repetate frecvent în acest volum este aceea că ştiinţa avansează gradual De exemplu, nu putem sări direct la a identifica relaţii cauzale între fenomene şi la a elucida mecanisme explicative pentru această stare de fapt, fără să fi găsit mai întâi că variabilele supuse analizei corelează între ele sau fără a explora iniţial fenomenul studiat De asemenea, chiar dacă suntem interesaţi de găsirea unor relaţii de tip cauzal, uneori nu este posibilă derularea unor experimente sau cvasiexperimente din motive etice sau de fezabilitate De exemplu, pentru a identifica impactul cauzal al statutului socioeconomic sau al genului persoanei asupra altor variabile de interes ar fi lipsit de etică sau imposibil să manipulăm variabilele amintite De aceea, prima linie de abordare a oricărui fenomen psihic studiat este reprezentată, de obicei, de studiile de tip non-experimental Acestea au drept caracteristică de bază faptul că măsurătorile au loc într-un context nemodificat (nemanipulat) de către cercetător, acest lucru fiind asociat frecvent cu ideea exercitării unui control redus asupra variabilelor cauzale de interes Spre deosebire de zona studiilor experimentale în cadrul căreia există un acord de clasificare a studiilor în două categorii majore (experimente şi cvasiexperimente), în cazul studiilor de tip non-experimental lucrurile nu stau la fel De exemplu, se vorbeşte despre studii de caz, despre sondaje de opinie, despre studii corelaţionale, despre studii comparative ex post facto, despre studii longitudinale etc , situaţie în care sunt amestecate criterii diferite de definire De altfel, Johnson ( apud Belli, ) concluziona după o trecere în revistă a nu mai puţin de de cărţi de metodologia cercetării din domeniul ştiinţelor sociale că nu există o poziţie unitară în modul de clasificare a diferitelor tipuri de studii non-experimentale, cele mai des menţionate fiind studiile corelaţionale, sondajele de opinie şi studiile comparative de tip ex post facto Acelaşi autor (Johnson, apud Belli, ) încerca să clasifice studiile non-experimentale în funcţie de două criterii: cel al temporalităţii, respectiv cel al scopului pentru care era efectuată cercetarea După primul criteriu, s-ar putea vorbi despre studii retrospective, studii transversale (cross-sectional) şi despre studii prospective În studiile retrospective, o variabilă este măsurată în prezent, iar alta este înregistrată din trecut, ideea de bază fiind aceea de a reflecta în ce măsură starea prezentă a putut fi anticipată de observaţiile colectate cu referire la trecut În studiile transversale, toate variabilele sunt colectate în acelaşi timp, la momentul derulării studiului În studiile prospective, o variabilă este măsurată în prezent, iar cel puţin o altă variabilă este măsurată ulterior, în viitor, încercându-se să se realizeze o legătură predictivă între cele două După cel de-al doilea criteriu, vorbim despre studii descriptive, despre studii predictive şi despre studii cauzal-explicative (cu valenţe exploratorii) Cele trei tipuri de studii au fost discutate pe larg în cel de-al treilea capitol al cărţii Aici vom sublinia doar diferenţa dintre studiile predictive şi cele cauzal-explicative Primele, deşi au în vedere studierea variabilelor psihologice într-o succesiune temporală, nu urmăresc identificarea unei relaţii de tip cauzal, ci doar surprinderea unor factori antecedenţi (de exemplu, realizarea de studii în care dificultăţile materiale din cadrul unei relaţii de cuplu prezic durata căsniciei) Din combinarea celor două criterii de clasificare ar rezulta nouă tipuri diferite de studii non-experimentale De exemplu, un studiu transversal descriptiv ar putea fi constituit de derularea unui studiu de screening pentru a cunoaşte care este prevalenţa cazurilor de depresie majoră diagnosticată clinic în rândul populaţiei de adolescenţi În schimb, un studiu retrospectiv predictiv ar putea urmări măsura în care adolescenţii depresivi, faţă de un lot similar control, au fost expuşi în mai mare măsură în copilăria lor timpurie (până la ani) la cazuri înregistrate oficial de violenţă domestică Deşi clasificarea respectivă poate fi una demnă de atenţie dintr-o perspectivă pedagogică, ea suferă de două mari neajunsuri Primul, şi cel mai important dintre ele, se referă la faptul că un anumit tip de studii non-experimentale poate fi clasificat în categorii multiple De exemplu, studiul de caz poate viza o abordare descriptivă transversală, cum la fel de bine poate fi centrat pe oferirea de posibile explicaţii (cu rol explorator) obţinute într-un demers longitudinal prospectiv De asemenea, sondajele de opinie pot fi derulate cu rol descriptiv sau predictiv, vizând aspecte transversale sau retrospective ş a m d De aceea, clasificarea nu este una potrivită pentru a surprinde specificul anumitor tipuri particulare de studii non-experimentale Cel de-al doilea neajuns se referă la titulatura aleasă pentru unul dintre criteriile de clasificare Astfel, a spune despre studiile de tip non-experimental că pot urmări obiective explicative presupune o forţare a lucrurilor, pentru că aşa cum am descris pe parcursul acestei lucrări, studiile de tip non-experimental vizează mai degrabă obiective de tip exploratoriu, descriptiv sau descriptiv-analitic, din cauza multiplelor limite la nivelul posibilelor variabile confundate pe care le implică (absenţa controlului prin design) Din acest punct de vedere, o clasificare mai bună, ţinând cont de obiectivul studiului urmărit, este de a le împărţi în studii exploratorii, studii descriptive şi studii predictive (analitice), cele din urmă având o paletă largă de opţiuni care merg de la simpla asociere de variabile la situaţia inferării unor afirmaţii de tip cauzal (în cazul unor studii non-experimentale longitudinale) Dată fiind această eterogenitate a poziţiilor de clasificare a tipurilor de studii, precum şi posibila suprapunere şi întindere a acestora pe multiple paliere, vom renunţa la includerea diferitelor studii non-experimentale în anumite categorii specifice, preferând o abordare pragmatică, bazată pe expunerea celor mai întâlnite tipuri de studii non-experimentale De aceea, în cele ce urmează vom prezenta pe rând patru categorii de studii transversale: studiile de caz, sondajele de teren, studiile corelaţionale şi studiile de diagnostic, un tip de studii retrospective – comparaţiile de tip ex post facto, cunoscute şi sub denumirea de studii caz-control (case-control studies) şi un tip de studii prospective (studiile longitudinale pe cohorte) Din motive de spaţiu tipografic, în cadrul fiecăruia dintre acestea vom sublinia doar elementele definitorii şi câteva aspecte aplicative importante Fiecărui dintre aceste tipuri de studii i-ar putea fi dedicate capitole sau chiar cărţi întregi dacă ar fi abordate într-o manieră comprehensivă Înainte de a aborda fiecare dintre aceste tipuri majore de studii, vom prezenta în cadrul tabelului principalele avantaje şi dezavantaje ale fiecăruia, pornind de la unele criterii menţionate de Petrie şi Sabin ( ) sau în WHO ( ) Tabelul O sinteză a utilităţii şi limitelor principalelor tipuri de studii non-experimentale Aspect evaluat Studiu de caz Sondaj de opinie Studiu corelaţional Studiu de diagnostic Comparaţie ex post facto Studiu longitudinal  Aspectul descriptiv Ilustrarea de cazuri prototipice sau a celora care diverg de la modelul teoretic Gradul de extindere a problemei Analiza asocierii dintre problema studiată şi alţi predictori (factori de risc sau protectori) Anumite designuri complexe, cum ar fi ecuaţiile structurale, pot testa criteriul statistic al unei relaţii cauzale Gradul de corectitudine în predicţie Poate fi util pentru a sugera relaţii de tip cauză-efect în cazul unor tulburări rare şi pentru a prezenta aspecte descriptive Evidenţa cazurilor noi  Aspectul predictiv/cauzal  Nu este potrivit pentru analiza cauzală  Aceste studii sunt foarte potrivite pentru obiective analitice de tip predictiv, însă nu şi pentru cele de tip cauzal  Este cel mai potrivit design dintre cele non-experimentale pentru a fi utilizat în studii cu obiective cauzale Potrivit pentru identificarea factorilor de risc şi a celor protectivi  Aspect explicativ Poate sugera explicaţii care vor fi ulterior testate adecvat Nerecomandat pentru a oferi explicaţii pentru fenomenul observat Nerecomandat pentru a oferi explicaţii pentru fenomenul observat Nu vizează scopuri de tip cauzal-explicativ, fiind exclusiv studii predictive (cu rol prognostic) Poate sugera explicaţii care vor fi ulterior testate adecvat Poate sugera posibile explicaţii pentru fenomenul studiat, însă acestea au un caracter exploratoriu  Selecţia participanţilor Cei afectaţi de problema studiată, îndeosebi cazurile rare Participanţi neselecţionaţi (cu sau fără a fi afectaţi de problema studiată) Participanţi neselecţionaţi (cu sau fără a fi afectaţi de problema studiată) Se apelează la participanţi selecţionaţi special pe baza unor teste standard Participanţii sunt selecţionaţi astfel încât comparaţia să fie făcută între două loturi similare, cu excepţia variabilei criteriu utilizată pentru formarea grupelor Utilizarea de participanţi selecţionaţi sau neselecţionaţi este dependentă de tipul de design longitudinal implementat  Impactul variabilelor confundate Foarte ridicat din cauza riscului de subreprezentare a constructului Redus, dacă există o definire clară a problemei cercetate Destul de ridicat, din cauza problemei celei de-a treia variabile Redus, deoarece sunt urmărite exclusiv scopuri prognostice sau de diagnostic, fără a infera aspecte cauzale Destul de ridicat, fiind necesare măsuri adecvate de asigurare a similarităţii grupelor comparate Destul de ridicat, îndeosebi legat de aspecte precum istoricul maturarea şi mai ales pierderea participanţilor  Resurse implicate Foarte reduse Costuri financiare ridicate, timp redus de implementare Destul de reduse, atât ca timp, cât şi financiar Medii Destul de reduse Foarte mari, atât financiare, cât şi ca timp de implementare  Utilitate ridicată mai ales în studii ce urmăresc Generarea de ipoteze şi studii viitoare pornind de la cazuri particulare Stabilirea prevalenţei fenomenului Identificarea unor predictori relevanţi pentru fenomenul studiat Diagnosticul şi/sau screeningul unei probleme Sugerarea unor posibili factori cauzali sau antecedenţi (predictori), responsabili pentru diferenţele dintre loturi Stabilirea incidenţei fenomenului şi a unor relaţii de tip cauză-efect, acolo unde nu pot fi derulate studii experimentale   Studiile de caz Primul tip discutat de studii non-experimentale este studiul de caz În esenţa sa, această strategie de cercetare vizează aspecte descriptive, ilustrative, cum ar fi acela de a reflecta printr-un demers deductiv o anumită teorie sau stare de fapt existentă la nivel general printr-unul sau mai multe cazuri particulare care să sprijine ideile cu un caracter mai ridicat de generalitate Însă demersul logic poate fi la fel de bine unul inductiv, astfel încât pornind de la caracteristicile observate în situaţii particulare să fie emise anumite teorii sau explicaţii de natură psihologică, pentru o anumită stare de fapt Din acest punct de vedere, Sigmund Freud rămâne cel mai cunoscut om de ştiinţă din sfera psihologiei şi care a conferit studiului de caz un rol central printre metodele de cercetare utilizate pentru elaborarea şi modificarea teoriilor sale psihanalitice De altfel, Kazdin ( ) oferă o foarte bună trecere în revistă a diferitelor roluri (scopuri) care pot fi trasate studiilor de caz Astfel, un prim rol important al studiilor de caz este acela de a servi drept sursă de idei şi de ipoteze, de conceptualizare teoretică a unui fenomen, aspecte ce vor fi ulterior sprijinite sau nu prin dovezi empirice colectate din studii de alt gen Această perspectivă conferă studiilor de caz dimensiunea exploratorie Din acest punct de vedere, studiile de caz pot fi utile pentru a oferi insighturi nu numai despre aspectele teoretice implicate în cazul analizat, ci şi cu privire la eficienţa unor anumite tehnici utilizate în soluţionarea problemei respective În al doilea rând, studiile de caz sunt mijloace excelente de descriere a unor fenomene rare Studierea intensivă a acestor cazuri, care nu pot fi analizate prin alte metode de cercetare din motive pragmatice/de fezabilitate, poate oferi informaţii valoroase, îndeosebi de natură descriptivă, dar şi exploratorie În al treilea rând, studiile de caz pot fi utilizate ca mijloc pentru a solicita revizuirea/regândirea unui anumit model teoretic, prin prezentarea acelor cazuri care contravin sau nu susţin anumite modele sau teorii existente în legătură cu fenomenul studiat În sfârşit, fiind o abordare intensivă bazată pe o descriere detaliată a unei stări de fapt, studiile de caz au un rol pedagogic important, prin facilitarea înţelegerii nuanţelor ce însoţesc fenomenul studiat de către specialişti Datorită acestor multiple roluri pe care le poate avea studiul de caz, Sechrest et al ( apud Kazdin ) afirmau că acestea pot informa, intriga, inspira şi incita cititorii să aprofundeze problema studiată Din punct de vedere tehnic putem întâlni studii de caz singulare, respectiv serii de studii de caz Cel din urmă aspect se referă la un set de studii de caz care vizează explorarea/descrierea aceleiaşi probleme analizate De asemenea, obiectul studiului de caz este o unitate de analiză care poate fi de orice mărime, cum ar fi o persoană, o echipă de muncă, o organizaţie etc Formatul studiilor de caz nu este unul impus, însă cel mai frecvent conţine printre secţiuni: (a) o descriere a obiectivului studiului de caz/argumentarea selectării cazului respectiv; (b) date despre istoricul personal al individului analizat sau despre contextul/specificul organizaţiei studiate; (c) descrierea problemei supuse analizei de caz; (d) o evaluare psihologică a persoanei investigate/o diagnoză a organizaţiei supusă analizei; (e) o discuţie a posibilelor cauze responsabile pentru starea de fapt respectivă; (f) intervenţii utilizate pentru ameliorarea/optimizarea situaţiei, precum şi (g) probleme întâmpinate şi/sau rezultate obţinute Liantul dintre cele şapte secţiuni specificate este oferit de perspectiva teoretică utilizată în studiul cazului respectiv Astfel, abordarea teoretică are un rol important în realizarea studiilor de caz, fiind esenţială în realizarea de inferenţe pornind de la anumite manifestări comportamentele observabile, spre constructele psihologice abstracte cărora li se atribuie responsabilitatea pentru aceste manifestări comportamentale O exemplificare a unui asemenea studiu de caz în domeniul clinic, din perspectiva teoriei raţional-emotive, este oferită de David ( ) Caseta Specificul analizei datelor în studiile de caz Spre deosebire de celelalte tipuri majore de studii, cum ar fi studiile experimentale în care reglarea aspectelor de interes se realizează îndeosebi prin design, iar aparatul statistic este utilizat pentru a răspunde unor obiective de tip cauzal sau explicativ, în cazul studiilor de caz se apelează la o strategie diferită de analiză a datelor Astfel, dat fiind caracterul explorator al multor studii de caz, modul de colectare şi analiză a datelor contribuie la formularea (sugerarea) unor mecanisme cauzale sau explicative prin apelul nemijlocit la capacitatea autorului de a analiza critic situaţia descrisă şi de a face inferenţe corecte Hartley ( ) trece în revistă asemenea strategii, cum ar fi: (a) accentul pus pe surprinderea unor categorii (teme) centrale pentru problematica respectivă şi pe gradul de potrivire dintre un anumit tipar/model teoretic şi cazul prezentat (studii de caz în scop descriptiv); (b) referirea la date care sprijină o anumită explicaţie teoretică, în paralel cu respingerea unor explicaţii alternative (studii de caz exploratorii cu referire la potenţiale mecanisme cauzal-explicative) Din acest punct de vedere, în studiile de caz se procedează similar situaţiilor din alte strategii de cercetare, punându-se o valoare mai mare pe acele informaţii care permit inferenţe specifice, de sprijinire a unei anumite teorii/explicaţii şi care, totodată, elimină alte explicaţii alternative concurente Specificul studiilor de caz de a aprofunda înţelegerea unei probleme în contextul natural al individului/organizaţiei evaluate conduce însă şi la un neajuns important, acela de a renunţa la controlul sistematic al variabilelor care ar putea pune în pericol validitatea acestor rezultate De aceea, studiile de caz au un nivel scăzut al validităţii interne şi externe, aspect care poate fi compensat într-o anumită măsură prin strategia de a descrie o serie de cazuri care să „replice” ideile subliniate prin acest demers În pofida acestor neajunsuri, studiul de caz reprezintă o strategie de cercetare respectabilă, fiind foarte utilă în scopuri exploratorii şi descriptive O altă strategie de compensare a neajunsurilor unui studiu de caz, considerată a fi una superioară, este aceea de a apela la designul experimentelor realizate pe un singur individ (single-case experimental design) Detalii despre această strategie de cercetare pot fi găsite în Barlow, Nock şi Hersen, , iar în limba română o scurtă introducere este disponibilă în Vîrgă, Sondajele de opinie Această strategie de cercetare, deosebit de cunoscută în spaţiul public românesc datorită apariţiei frecvente în mass-media a rezultatelor obţinute pe teme politice, are o denumire mai puţin fericită, deoarece ideea de a efectua un sondaj (survey) poate viza nu numai aspecte de opinie (de exemplu, „Ce marcă de bere preferaţi?”), ci şi aspecte factuale (de exemplu, „Aţi consumat bere în ultimele de ore?”) Unii autori preferă utilizarea altor denumiri, precum anchetă de teren sau anchetă sociologică Din nefericire, nici aceste nume nu sunt cele mai potrivite pentru a descrie întreaga sferă de cuprindere a sondajelor, dacă luăm în considerare progresele tehnologice evidente (multe anchete nu se mai derulează pe teren, ci prin intermediul internetului sau telefonic), respectiv aria de aplicabilitate (deşi sondajul este un instrument de bază în domeniul sociologiei, aplicabilitatea sa nu se rezumă doar la acest domeniu al cunoaşterii) Din anumite puncte de vedere, sondajele reprezintă opusul studiilor de caz Dacă studiile de caz vizează surprinderea aspectelor unice, a excepţionalului, focalizându-se asupra fenomenului într-o manieră intensivă, dar nesistematică, sondajele de opinie vizează surprinderea aspectelor generale, a tendinţelor comune, focalizându-se într-o manieră extensivă şi sistematică asupra fenomenului studiat De asemenea, dacă studiile de caz urmăresc predominant o metodologie calitativă de colectare şi interpretare a rezultatelor, sondajele sunt, prin definiţie, o strategie de cercetare cantitativă din prisma colectării, analizei şi interpretării rezultatelor Însă ambele au drept element comun faptul că pot servi unor scopuri de cercetare de tip descriptiv sau exploratoriu Prin modalitatea riguroasă, sistematică, de planificare, derulare şi analiză a rezultatelor, sondajul poate fi evaluat mai uşor din perspectiva validităţii concluziilor sale comparativ cu situaţia unui studiu de caz De aceea, în paginile următoare vom detalia o serie de puncte importante în planificarea şi derularea unui sondaj de opinie, adresând problema eşantionării, a volumului eşantionului, a ratei de răspuns, dar şi aspecte legate de construirea chestionarului şi de selectare a celei mai bune strategii de colectare a datelor Ne vom rezuma doar la cazul celor implementate transversal (un singur val de măsurare), problematica sondajelor derulate într-un context longitudinal fiind abordată în secţiunea următoare ( ), dedicată studiilor pe cohorte Problematica eşantionării Sondajele de opinie presupun chestionarea unei anumite părţi din populaţia de interes, cu scopul de a infera aspecte cu un nivel ridicat de generalizare (la nivelul populaţiei din care a fost extras eşantionul) Astfel, spre deosebire de situaţia unui referendum, în care cel puţin la nivel teoretic este inclusă în analiză întreaga populaţie investigată, în cazul sondajelor sunt extraşi doar anumiţi participanţi pentru a fi chestionaţi În limba română, unele şcoli de sociologie şi psihologie fac diferenţe terminologice între un eşantion de participanţi şi un lot de participanţi, în funcţie de modul în care a avut loc selecţia Termenul „eşantion” este rezervat situaţiei în care extragerea din cadrul populaţiei de interes s-a făcut prin metode probabilistice de selectare a participanţilor, iar „lot” este utilizat în cazul în care selecţia s-a făcut prin metode neprobabilistice Diferenţa dintre cele două categorii de metode este importantă, deoarece doar metodele probabilistice (aleatorii) de selectare a participanţilor asigură şanse egale de a fi extraşi tuturor indivizilor din cadrul unei populaţii, o caracteristică ce minimizează riscul de a obţine rezultate distorsionate Cel mai simplu exemplu pentru a înţelege diferenţele dintre cele două forme este reprezentat de sondajele realizate de diferite posturi TV în timpul emisiunilor Să luăm de exemplu, postul de ştiri Antena În timpul unei emisiuni politice, moderatorul adresează telespectatorilor întrebarea: „Susţineţi candidatura lui Crin Antonescu la preşedinţia României?”, aşteptând răspunsurile pe forumul şi pe pagina de Facebook a emisiunii Rezultatele indică faptul că % dintre telespectatori exprimă o opinie favorabilă faţă de această candidatură, iar concluzia moderatorului este aceea că există o susţinere clară din partea românilor faţă de acest actor politic Dar este rezultatul unul valid? Este foarte probabil ca procentul obţinut de către Crin Antonescu să fie unul distorsionat faţă de realitate, în sensul că el nu a fost obţinut pe baza unui eşantion probabilistic, ci în baza unuia neprobabilistic De ce se întâmplă acest lucru? Pentru că studiul s-a bazat (a) doar pe opinia celor care sunt telespectatori ai Antenei şi ai emisiunii respective (cei care nu au vizionat emisiunea şi/sau care nu urmăresc postul respectiv de televiziune nu au avut şanse egale de a fi cuprinşi în eşantion) şi (b) chiar dintre cei care au urmărit emisiune, o bună parte, îndeosebi cei din mediul rural, nu au putut răspunde dat fiind că răspunsurile necesitau acces la internet Să ne imaginăm care ar fi fost rezultatul dacă sondajul era iniţiat de un post TV cu viziuni politice diferite, precum B TV Prin urmare, între metodele probabilistice sunt cuprinse doar acelea care oferă şanse egale de a fi selectaţi în eşantion indivizilor din populaţia de interes, în timp ce metodele neprobabilistice nu oferă şanse egale, selectarea subiecţilor în studii făcându-se pe baza altor criterii, cum ar fi cel al oportunităţii (disponibilităţii) de a fi incluşi în studiu În caseta sunt trecute principalele tehnici de eşantionare utilizate în mod curent, cu precizarea că prin populaţie nu se are în vedere ceea ce se înţelege în termeni comuni (de exemplu, populaţia României), ci populaţia variabilei de interes (de exemplu, populaţia firmelor mici şi mijlocii, cu regim juridic de tip microîntreprindere; populaţia persoanelor divorţate; populaţia studenţilor la psihologie din centrul universitar Timişoara etc ) Caseta Tehnici de eşantionare probabilistice şi neprobabilistice Tehnici probabilistice Tehnica de eşantionare aleatorie simplă Presupune selectarea din cadrul unei liste alfabetice ce conţine populaţia de interes (de exemplu, masteranzi din Universitatea de Vest din Timişoara) a unui număr de participanţi egal cu volumul stipulat al eşantionului De exemplu, dacă se doreşte extragerea unui număr de de studenţi din listele respective ce cuprind un total de de participanţi posibili, se poate apela la tabele cu numere aleatorii sau la aplicaţii informatice cu extragere aleatorie a de numere de la la , fără posibilitatea repetării numărului deja extras (în limbaj informatic este o procedură quasi-random) Tehnica este eficientă (a) dacă populaţia nu este una foarte mare, deoarece pentru populaţii mari, situate în diverse locaţii, costurile de acest tip cresc, sau (b) în contextul în care aplicarea are loc în mediul electronic, fiind însă dependentă de existenţa unei baze de date cu toate cazurile eligibile (adrese de e-mail) spre a fi incluse în eşantionare Tehnica de eşantionare aleatorie sistematică Reprezintă o derivare de la metoda aleatorie simplă, apelându-se la un pas de eşantionare De exemplu, într-un studiu în care se doreşte selectarea probabilistică a de participanţi dintr-o populaţie de de locuitori (raportul de selectare fiind din ), se poate alege într-o manieră aleatorie un număr de la la (de exemplu, numărul ), iar apoi să fie selectaţi participanţii pe baza acestui pas de (de exemplu, persoanele având numerele , , , ) Avantajul acestei tehnici faţă de cea aleatorie simplă este acela că poate fi implementată şi în absenţa unei liste nominale De exemplu, poate fi chestionată fiecare a zecea gospodărie dintr-un cartier, atâta timp cât se cunoaşte cu aproximaţie volumul populaţiei de investigat pentru a calibra pasul de eşantionare într-un mod adecvat (de exemplu, dacă populaţia este constituită din de unităţi şi se doreşte un eşantion de de unităţi se poate utiliza un pas de ) Tehnica de eşantionare cluster Tehnica de eşantionare de tip cluster presupune aplicarea principiului probabilistic (egalitate de şanse) asupra categoriei (grupului) din care face parte individul vizat De exemplu, într-un studiu efectuat pe studenţi de la nivelul ciclului de licenţă de la toate specializările, ar fi dificil din punct de vedere practic de utilizat un algoritm de selectare precum cel al evaluării aleatorii sistematice sau al celei simple În schimb, ar fi mai uşor să se selecteze aleatoriu câteva grupe de studenţi (de exemplu, grupa a II-a din anul II de la specializarea Finanţe-Bănci; grupa I de la specializarea Psihologie din anul III etc ), urmând a fi chestionaţi toţi studenţii din grupele respective Avantajul acestei tehnici este de natură practică, fiind mult mai uşor de colectat datele printr-un asemenea demers Această facilitate vine însă cu un cost, eşantionarea de tip cluster fiind metoda cu cel mai ridicat risc de distorsiune a rezultatelor dintre metodele de tip probabilistic Tehnica de eşantionare stratificată Această tehnică este utilă în cazul în care se doreşte a se ţine seama de anumite caracteristici importante ale populaţiei de interes (de exemplu, într-un studiu realizat pe studenţi ar fi important să luăm în considerare anul de studii în care se află aceştia) Astfel, se poate apela la o strategie aleatorie simplă sau la una sistematică, care să nu fie aplicată pe întreaga listă de studenţi de la nivelul de studii licenţă, ci separat, pe fiecare listă de studenţi, cea a studenţilor din anul I, a celor din anul II, respectiv pe a celor din anul III O asemenea strategie are sens atunci când asemenea criterii (precum anul de studii), denumite în termeni sociologici straturi (strata), pot avea un impact asupra tipului de răspuns relevant şi dorim să controlăm acest lucru Din punct de vedere statistic, eşantionarea stratificată prezintă cel mai scăzut risc de rezultate distorsionate dintre metodele probabilistice amintite până acum, desigur, dacă straturile utilizate au o relevanţă mare asupra tipului de răspuns oferit De asemenea, acest tip de eşantionare este util atunci când se doresc a fi realizate analize la nivel de categorii/subgrupe Din punct de vedere practic este mai dificil de implementat o asemenea eşantionare Ea necesită resurse de timp şi costuri suplimentare, mai ales dacă se urmăresc criterii combinate, cum ar fi surprinderea concomitentă a anului de studii şi a statutului studentului (bugetar sau cu taxă), în observarea răspunsurilor colectate Desigur, în interiorul fiecărui strat sau combinaţii de straturi, selecţia participanţilor se face după criterii probabilistice, precum cele amintite anterior Tehnica de eşantionare multifazică (multistadială) Tehnica respectivă reprezintă, de fapt, combinarea secvenţială a tehnicilor probabilistice de tip cluster cu alte tehnici menţionate anterior Spre ilustrare, dacă Ministrul Educaţiei doreşte să implementeze un sondaj de opinie destinat elevilor de liceu din anul terminal pentru a afla opiniile acestora faţă de ideea introducerii bacalaureatului profesional, se poate recurge la următoarea schemă de eşantionare multifazică cu trei stadii succesive: (a) stratificată – gruparea unităţilor şcolare în funcţie de două criterii: poziţionarea liceului (în reşedinţa de judeţ vs în altă localitate din judeţ), respectiv în funcţie de performanţa anterioară la bacalaureat (licee cu procent de promovabilitate în anul anterior de peste %, licee cu promovabilitate cuprinsă între % şi %, respectiv licee cu o promovabilitate sub %); (b) eşantionare de tip cluster (de exemplu, din lista cu licee cu o promovabilitate medie situate în afara reşedinţei de judeţ sunt selectate % dintre unităţile şcolare – fiecare al -lea liceu din lista respectivă); (c) tot eşantionare de tip cluster (chestionarea tuturor elevilor din cadrul unei clase a XII-a din unităţile selecţionate, cu precizarea că dacă există mai multe clase terminale în liceul selectat, să fie chestionată clasa care se situează cel mai aproape de intrarea principală din şcoală) Ce ar însemna acest lucru? Să presupunem că % din unităţile şcolare înseamnă un număr de de unităţi (dintr-un total de de licee), iar din fiecare unitate este selectată o clasă (cu o mărime medie de elevi per clasă) S-ar totaliza un număr de de elevi de an terminal chestionaţi, repartizaţi procentual în funcţie de două criterii considerate a fi importante – performanţa liceului şi mediul de provenienţă al acestuia Eşantionarea multistadială (multifazică) este utilizată îndeosebi în contexte în care populaţia este alcătuită dintr-un număr mare de participanţi, cu o compoziţie eterogenă şi în care este dificil să se implementeze o eşantionare de tip aleatoriu dintr-o singură secvenţă (operaţie) Tehnici neprobabilistice Eşantionarea pe bază de convenienţă Destul de mulţi studenţi confundă acest tip de eşantionare cu una probabilistică, metoda fiind de departe cea mai întâlnită formă de eşantionare din domeniul psihologiei Apelarea la cunoştinţe sau la colegi pentru a completa un set de chestionare, utilizarea persoanelor întâlnite pe stradă, cererea opiniilor telespectatorilor etc constituie o eşantionare pe bază de convenienţă, deoarece nu se oferă şanse egale tuturor respondenţilor potenţiali De exemplu, într-un studiu în care un student apelează la colegii săi pentru a completa un chestionar, lotul constituit nu poate fi considerat un eşantion extras din populaţie, deoarece (a) este improbabil ca populaţia de interes să fie aceea a studenţilor cu statut de cunoştinţe, ci studenţii în general; (b) chiar dacă populaţia cu statut de cunoştinţe ar fi cea de interes, nu au fost oferite şanse egale nici măcar acestora, deoarece au fost testate doar cunoştinţele prezente/disponibile la momentul evaluării Ca urmare a acestui neajuns, rezultatele obţinute nu pot fi generalizate direct la nivelul întregii populaţii de interes, prin urmare validitatea externă a studiului are de suferit Pentru a compensa această stare de fapt, strategia alternativă de creştere a validităţii externe are în vedere replicarea rezultatelor în studii diferite, chiar dacă acestea s-au derulat pe loturi obţinute prin eşantionare neprobabilistică pe bază de convenienţă Eşantionarea ţintită Acest tip de eşantionare (purposive sampling), deşi este tot una neprobabilistică, poate fi utilă în contexte în care se investighează populaţii specifice, greu identificabile De exemplu, în studii despre somnambulism sau derulate pe persoane cu o orientare homosexuală, ar fi dificil şi nefezabil să ne bazăm pe o eşantionare generală din care să extragem doar acele cazuri de interes O variantă derivată din eşantionarea ţintită este cea de tip avalanşă (snowball sampling) În acest caz fiecare persoană chestionată este rugată să ofere referinţe/date de contact despre alte persoane care ar corespunde profilului căutat, având astfel acces la o adevărată reţea socială Deşi acest tip de eşantionare poate fi util în identificarea indivizilor cu anumite caracteristici de interes întâlnite rar, metoda prezintă aceleaşi dezavantaje pe care le au şi celelalte metode neprobabilistice de eşantionare Eşantionarea pe cote Eşantionarea pe cote îşi propune să elimine o parte din neajunsurile tehnicilor neprobabilistice, printr-o serie de măsuri menite să inducă impresia de reprezentativitate De exemplu, într-un studiu realizat pe o populaţie de studenţi la psihologie, în care există statistici care arată faptul că % dintre aceştia sunt de sex feminin, respectiv că % urmează cursurile unor universităţi particulare, se poate urmări respectarea acestor proporţii în lotul de respondenţi studiat De exemplu, dacă lotul conţine de studenţi, acesta ar trebui format din de bărbaţi ( de la universităţi de stat şi de la instituţii private) şi din de femei ( de la universităţi de stat şi de la cele private), astfel încât se respectă proporţia de gen şi de tip de instituţie urmată, de la nivelul populaţiei de interes Deşi acest tip de eşantionare pare a fi unul onorabil, nici el nu respectă principiul egalităţii de şanse în selecţie, persoanele fiind selectate în cotele respective, tot pe bază de convenienţă De aceea, în lipsa utilizării unor criterii aleatorii de selecţie, deşi au fost prestabilite anumite cote în cazul unor criterii relevante, există în continuare un risc crescut de a obţine rezultate distorsionate prin absenţa controlului asupra altor posibile variabile relevante De exemplu, rezultatele ar putea fi diferite dacă majoritatea răspunsurilor colectate de la studenţii unor universităţi de stat provin din centre universitare clasate în topul performanţei sau de la universităţi cu specializări mai puţin performante în psihologie Din perspectiva analizei validităţii rezultatelor unor sondaje, utilizarea unor metode probabilistice de eşantionare este singura cale care conduce la creşterea validităţii externe a rezultatelor prin posibilitatea de a generaliza (extinde) rezultatele obţinute de la nivelul eşantionului studiat la nivelul populaţiei de interes din care a fost extras eşantionul Datele provenite din sondaje realizate fără asigurarea unei metode aleatorii de selectare a respondenţilor prezintă un nivel ridicat de risc la adresa validităţii externe a rezultatelor, însă ele pot fi utile în scopuri descriptive sau exploratorii, din perspectiva altor tipuri de validitate precum este cea statistică sau cea de construct Problema mărimii eşantionului Investiţia de efort făcută cu ocazia selectării unui eşantion prin metode probabilistice nu este răsplătită decât pe jumătate în cazul în care volumul eşantionului nu este suficient de mare pentru a reduce amplitudinea intervalului de încredere asociat rezultatului obţinut la un nivel acceptabil Astfel, la baza reţetei succesului unui sondaj bine efectuat se regăseşte asocierea dintre utilizarea unei tehnici probabilistice pentru a selecta indivizii cuprinşi în eşantion şi asigurarea unui număr suficient de participanţi pentru a obţine reprezentativitatea rezultatului la nivelul întregii populaţii de interes din care a fost extras eşantionul Pentru a determina mărimea unui eşantion se are în vedere: (a) tipul de metodă probabilistică de eşantionare utilizată; (b) nivelul de eroare prespecificat; (c) nivelul de încredere în rezultate (probabilitatea ca ele să fie adevărate); (d) frecvenţa anticipată a scorului care constituie punctul central de interes Primul dintre cele patru elemente determină tipul de formulă utilizată, celelalte constituindu-se ca puncte variabile între care poate jongla cercetătorul pentru a atinge un maximum de eficienţă (acurateţe) cu un minimum posibil de costuri Formula pentru stabilirea numărului de subiecţi necesari a fi incluşi într-un studiu, pentru o eşantionare probabilistică simplă şi o populaţie numeroasă (de cel puţin ori mai mare decât volumul estimat al eşantionului) ar fi conform lui Crano şi Brewer ( ) următoarea:  unde p este procentul estimat oferit pentru un anumit răspuns, iar SE este eroarea standard, adică mărimea erorii pe care o putem tolera De exemplu, într-un sondaj pe teme politice, suntem angajaţi pentru a determina procentul estimat de voturi pe care l-ar putea înregistra o alianţă politică în condiţiile în care sondajele anterioare indicau că va obţine un procent de % În acest caz, p ia valoarea , (restul, de – p = , , fiind votanţii altor formaţiuni politice) De asemenea, ne dorim să avem o eroare de maxim ± , ( %), ceea ce înseamnă aproximativ × SE, pentru un interval de încredere de %, adică un SE de , Aplicând formula mai sus menţionată, estimăm că vom avea nevoie de aproximativ de persoane ( , × , / , × , ), pentru a afla cu o eroare de ± %, la un interval de încredere de % procentul real pe care l-ar obţine alianţa politică analizată În schimb, într-un alt studiu în care se doreşte a se investiga starea de fapt asupra unei probleme despre care nu există niciun fel de date statistice anterioare, se porneşte de la o valoare p egală cu , ( % şanse ca opinia să fie una favorabilă sau una nefavorabilă) În acest caz, aplicând aceeaşi formulă vom avea nevoie de de participanţi pentru o eroare de ± % la un interval de încredere de % [ , × ( – , )/( , × , )] sau chiar de de persoane, pentru a asigura o eroare de doar ± % la acelaşi interval de încredere de % [ , × ( – , )/( , × , )] Cu excepţia unor situaţii justificate, când preferinţele sunt foarte apropiate şi se doreşte o diferenţiere fină între acestea, opţiunea aleasă va lua în considerare cel mai bun raport cost-beneficiu Pentru situaţia descrisă, am opta probabil pentru un eşantion de de persoane în defavoarea celui format din de persoane (costurile fiind de aproximativ ori mai mici, în contextul în care eroarea de eşantionare creşte puţin, de la ± % la ± %) Mici ajustări ale acestei formule, cu un impact redus la nivelul volumului eşantionului, pot fi introduse: (a) dacă se are în vedere o altă metodă probabilistică decât cea simplă aleatorie; (b) dacă sondajul vizează o populaţie finită (în care raportul dintre totalul populaţiei şi volumul necesar al eşantionului este de cel mult ); (c) dacă se ţine cont de procentul real de respondenţi efectivi (de exemplu, din de votanţi eligibili, participă doar % la vot) Detalii despre aceste ajustări sunt disponibile în Ahmed ( ) sau Crano şi Brewer ( ) Fără a intra în detalii tehnice aici, se cuvine să precizăm că, la acelaşi număr de indivizi cuprinşi într-un eşantion, cea mai precisă estimare se obţine printr-o eşantionare aleatorie stratificată, urmată de o eşantionare aleatorie simplă, în timp ce un nivel ceva mai scăzut de precizie se obţine prin eşantionarea de tip cluster, mai ales dacă se apelează la investigarea unui număr redus de clustere de mari dimensiuni ( departamente a câte de indivizi fiecare) decât dacă se apelează la un număr mare de clustere de dimensiuni reduse ( de departamente, a câte indivizi fiecare) Desigur, aceste calcule merită făcute în cazul utilizării unor metode probabilistice În cazul apelului la metode neprobabilistice, formulele amintite nu îşi au sensul, volumul lotului fiind relevant doar din perspectiva puterii statistice de testare a ipotezelor În cazul utilizării de metode de eşantionare neprobabilistice există un risc crescut de rezultate distorsionate faţă de situaţia existentă la nivelul populaţiei O excepţie de la această stare de fapt este cazul în care între lotul extras şi populaţia din care acesta face parte raportul este apropiat de o valoare unitară Rata de răspuns vs rata refuzurilor Chiar dacă s-a apelat la o metodă de eşantionare aleatorie şi la un număr potrivit de participanţi, din punct de vedere teoretic rămâne un risc ridicat de distorsiune a rezultatelor dacă se constată o rată ridicată a refuzurilor de a răspunde De exemplu, dacă doar % dintre cei selectaţi iniţial în eşantion au acceptat să răspundă, iar % nu, se poate ajunge la o distorsiune în rezultate (de exemplu, s-ar putea obţine un procent mai mare de răspunsuri extreme, fie ele favorabile sau nefavorabile, decât s-ar fi obţinut dacă toţi cei selectaţi iniţial ar fi răspuns) Rata de răspuns se calculează făcând raportul simplu dintre cei care au răspuns şi totalul celor contactaţi pentru a oferi răspunsuri De exemplu, dacă doar de persoane au răspuns la un sondaj în care au fost contactaţi de participanţi eligibili, vom spune că există o rată de răspuns de % (sau o rată de refuz de %) Deşi teoretic sunt preferabile sondajele cu o rată cât mai ridicată de răspuns, pentru a reduce riscul apariţiei unei distorsiuni de selecţie, în practică, au fost sesizate diferenţe minore în acurateţea datelor între studiile cu rată scăzută şi cele cu rată ridicată de participare (Holbrook, Krosnick şi Pfent, ) Prin urmare, această problemă este mai puţin severă comparativ cu celelalte două aspecte discutate: extragerea eşantionului prin metode aleatorii, respectiv stabilirea numărului optim de subiecţi Construirea chestionarului Un sondaj bine realizat nu implică doar aspecte tehnice legate de selectarea şi construirea eşantionului, ci acordă la fel de multă atenţie aspectelor calitative legate de construirea şi formatul întrebărilor Întregul efort depus pentru a apela la metode de eşantionare probabilistice poate fi năruit dacă lipsesc abilităţile de a dezvolta eficient întrebările vizate De exemplu, o întrebare formulată ambiguu, de genul „Practicaţi sport regulat?” (răspunsuri: „Da” sau „Nu”), poate induce rezultate distorsionate pentru că unii pot răspunde afirmativ înţelegând prin termenul „regulat” ideea practicării săptămânale a unui sport, în timp ce alţii, care fac la fel de mult sport, pot răspunde negativ dacă înţeleg prin aceeaşi sintagmă ideea de sport practicat zilnic Tabelul prezintă o listă de probleme în construirea întrebărilor/a chestionarului în ansamblul său, precum şi soluţiile aferente, pornind de la o sinteză prezentată în Neuman ( ) Tabelul Sugestii pentru o redactare adecvată a întrebărilor dintr-un chestionar Problema identificată Formulare inadecvată Formulare adecvată  Aspecte legate de imprecizia formulării  evitarea abrevierilor, a jargonului, a unor termeni tehnici care pot crea dificultăţi de înţelegere ONG complexul lui Oedip Organizaţii neguvernamentale O definiţie funcţională care să însoţească termenul tehnic  evitarea ambiguităţii Practicaţi sport în mod regulat? Să se înlocuiască termenul „regulat” cu un aspect cuantificabil Practicaţi un sport: (a) zilnic; (b) de câteva ori pe săptămână; (c) săptămânal etc  evitarea dublei chestionări Vă plac filmele SF şi cele de groază? Se construiesc două întrebări separate, una care să vizeze filmele SF, cealaltă filmele de groază  evitarea întrebărilor cu răspuns dificil Câţi litri de benzină consumaţi în medie pe an? Câţi litri de benzină consumaţi în medie pe săptămână?  evitarea negaţiilor şi a dublei negaţii Absolvenţilor de liceu nu ar trebui să li se permită să se înscrie la facultate dacă nu au promovat bacalaureatul? O exprimare directă care să nu îngreuneze înţelegerea textului: Absolvenţii de liceu se pot înscrie la facultate dacă promovează examenul de bacalaureat  lipsa de ancore în oferirea răspunsului, dacă este nevoie de o estimare În medie, cât de mult alcool consumaţi într-o lună? Segmentarea întrebării în contexte concrete (în baruri, acasă; în vizite la prieteni/rude), urmată de o subsumare a acestora  Aspecte legate de inducerea (sugerarea) unui răspuns  evitarea exprimărilor cu încărcătură emoţională ridicată sau care pun presiune suplimentară pe respondent Politica organizaţiei este de a arăta o grijă suplimentară faţă de problemele de mediu, prin reducerea cantităţii de documente tipărite Susţineţi această poziţie? Susţineţi măsura de a reduce cantitatea de documente tipărite?  evitarea sugestiilor din întrebare Ar trebui primăria să acorde mai mulţi bani pentru asfaltarea drumurilor? Selectaţi care ar fi cel mai important domeniu care ar trebui finanţat de primărie: (a) problemele de canalizare; (b) asfaltarea drumurilor etc  evitarea falselor premise Pentru a reduce lungimea rândului de aşteptare, aţi fi de acord cu extinderea programului de lucru a biroului de relaţii cu publicul? Cum apreciaţi situaţia orarului de lucru a biroului de relaţii cu publicul: (a) ar putea fi extins (b) ar putea fi păstrat aşa; (c) ar putea fi redus  evitarea chestionării situaţiilor ipotetice (intenţiilor) Să presupunem că s-ar deschide un nou magazin ABC pe strada ta Ai cumpăra de acolo? Preferabilă ar fi chestionarea comportamentelor curente (de exemplu, unde îşi face în prezent cumpărăturile, ca tip de magazin (mall vs de cartier), ca frecvenţă (zilnic vs săptămânal) şi ca localizare (distanţa faţă de casă)  reducerea răspunsurilor cu un nivel ridicat al dezirabilităţii sociale Subiectele sensibile conduc la o subestimare a activităţilor negative (de exemplu, conducerea maşinii fără a purta centura de siguranţă) şi la o supraestimare a frecvenţei activităţilor pozitive (de exemplu, mersul la bibliotecă) Strategii multiple precum: (a) garanţii explicite pentru păstrarea confidenţialităţii; (b) sublinierea importanţei colectării unei situaţii reale; (c) reformularea întrebărilor la persoana a III-a; (d) apelul la sondaje derulate fără contact vizual (cum ar fi cele derulate prin internet)  diminuarea efectului de ordine (de reportare) Se aplică două întrebări cu o ordine fixă: atitudinea faţă de conducerea maşinii sub influenţa alcoolului; apoi faţă de viol Alternarea ordinii celor două întrebări sau utilizarea unei strategii care presupune trecerea dintre întrebări generale (abstracte) spre cele specifice  diminuarea efectului capului de listă Citirea unei liste cu un număr destul de ridicat de răspunsuri în aceeaşi ordine (de exemplu, alfabetică) Rotirea (contrabalansarea) răspunsurilor sau confecţionarea de cartonaşe cu fiecare răspuns, astfel încât ordinea de citire a lor de la un respondent la altul să fie una aleatorie  Alte aspecte care pot distorsiona rezultatele  lipsa unor categorii adecvate de răspuns Lucraţi sau sunteţi şomer? Vârsta Dvs : (a) între şi ; (b) între şi de ani; (c) între şi de ani Nu sunt luate în seamă toate categoriile posibile (studenţii, pensionarii etc ) Vârsta în ani împliniţi: (a) între şi ; (b) între şi ; (c) între şi de ani  utilizarea de întrebări-filtru Variante care forţează oferirea unui răspuns „Cât de mult vă place berea X?”: (a) foarte mult; (b) mult; (c) puţin; (d) foarte puţin Fie sunt utilizate mai multe variante de răspuns, inclusiv NŞ (nu ştiu/nu o cunosc), fie se introduce mai întâi o variabilă filtru („Aveţi o părere despre berea X?”)  grijă faţă de distorsiunile posibile în cazul întrebărilor de cunoştinţe Apreciaţi activitatea politică a lui Nicolae Dică? Surprinzător, un număr destul de însemnat de respondenţi ar răspunde la întrebarea respectivă, deşi personajul respectiv a fost un fotbalist Ar putea fi utilizate întrebări de control (capcană) de genul celei prezentate, pentru a diferenţia între cei care fac aprecieri în cunoştinţă de cauză şi celelalte cazuri   Selectarea celei mai potrivite strategii de aplicare a chestionarului Sondajele pot fi implementate fie direct, pe teren (prin operatori care realizează interviuri faţă în faţă cu persoanele din eşantionul selectat) sau telefonic (fără a beneficia de o relaţie faţă în faţă cu interlocutorul), fie indirect, printr-o abordare clasică (chestionare trimise prin poştă) sau una modernă (prin intermediul internetului şi/sau al sms-urilor) Decizia de a opta pentru una sau alta din variantele menţionate este dependentă de doi factori: (a) costurile implicate; (b) caracteristicile sondajului Tabelul sintetizează câteva dintre cele mai importante criterii de care ar trebui să se ţină seama în alegerea modalităţii de implementare a sondajului De exemplu, dacă sondajul este unul scurt şi pe o temă cunoscută publicului larg, iar datele colectate trebuie prelucrate şi analizate cât mai rapid, s-ar putea apela la sondajul telefonic, deoarece acesta corespunde cel mai bine celor trei criterii menţionate În mod similar, dacă populaţia de interes este una selecţionată (de exemplu, masteranzi), iar subiectul abordat este unul delicat (aspecte factuale şi de opinie despre plagiat şi copiat la examene), se poate apela la un sondaj derulat pe internet, dacă există acces la informaţii personale ale studenţilor cum ar fi adresa de email a acestora pentru a putea păstra ideea extragerii aleatorii a listei de respondenţi, cu posibilitatea păstrării anonimatului (printr-o legătură către pagina web unde se găseşte chestionarul) Tabelul Direcţii posibile de implementare în funcţie de caracteristicile sondajului de opinie Aspect vizat Sondaj pe teren Sondaj telefonic Sondaj prin poştă Sondaj pe internet  Buget necesar ridicat mediu redus redus  Lungimea chestionarului mare mică medie medie  Durata perioadei de colectare medie scurtă foarte lungă lungă  Rata răspunsurilor mare medie mică mică  Teme sensibile inadecvat parţial adecvat adecvat adecvat  Nivelul de educaţie al respondentului irelevant puţin relevant studii medii şi superioare studii medii şi superioare  Accesul la întreaga populaţie ridicat relativ ridicat ridicat mediu (urban)/scăzut (rural)  Explicitarea aspectelor complexe (neclarităţilor) posibilă redusă absentă absentă   Alte aspecte relevante în construirea şi derularea sondajelor de opinie În cazul sondajelor de opinie realizate faţă în faţă sau telefonic se apelează la operatori de teren Dincolo de aspectele tehnice deja menţionate, corectitudinea rezultatelor este dependentă de calitatea instruirii acestora, de motivarea lor de a colecta precis datele şi de măsurile de control postaplicare ale calităţii datelor colectate Acest lucru este important de cunoscut pentru a reduce tendinţa operatorilor de a fabrica datele şi/sau de a nu respecta procedura de eşantionare convenită Dacă problema calităţii operatorilor afectează sondajele directe, îndeosebi studiile de teren, problematica acurateţei listelor din care se extrage eşantionul de participanţi prin metode probabilistice afectează toate tipurile de sondaje, îndeosebi pe cel realizat prin internet, secondat de sondajul telefonic De exemplu, în SUA, deşi % dintre gospodării au un telefon, doar % dintre acestea sunt identificabile public, fiind trecute în cartea de telefon Acest lucru înseamnă că nu există şanse egale pentru toţi participanţii de a fi selectaţi în studiu, deoarece unii dintre ei nu se regăsesc pe lista din care se extrage în mod aleatoriu eşantionul studiat (Crano şi Brewer, ) Pentru a suplini asemenea deficienţe au fost concepute o serie de strategii alternative de lucru, cum ar fi, în cazul sondajelor telefonice, apelarea aleatorie (random digit dialing) (de exemplu, se extrage un număr din cartea de telefon, iar ultimele două cifre sunt regenerate automat pentru a suna aleatoriu la un nou număr de telefon, ce poate fi inclus sau nu în cartea respectivă de telefon) Mesajul legat de această problemă a listelor (a bazei de date existente) este acela că nivelul calitativ al implementării procedurii de randomizare este dependent de calitatea listei ce conţine întreaga populaţie de interes (în exemplul oferit, % din populaţie, care nu deţine un telefon, fiind totuşi exclusă din cercetare) În cazul sondajelor de teren, problema poate fi una similară, în sensul că unele persoane se pot afla în situaţia de a nu se regăsi pe listele concepute de autorităţi Să ne amintim de întreaga discuţie privind acurateţea listelor de electori cu ocazia ultimului referendum de suspendare a preşedintelui Traian Băsescu Pentru a reduce problema inadvertenţelor din liste, în cazul sondajelor de teren se obişnuieşte a se apela la o rută de deplasare care să asigure şanse egale de a accesa toate gospodăriile de interes, nu doar pe acelea înregistrate corect în listele oficiale În sfârşit, o atenţie deosebită trebuie acordată nuanţelor în formularea întrebărilor din chestionare, pentru a viza direct aspectul urmărit şi pentru a nu se produce confuzii, cum ar fi aceea de a măsura opinii în locul unor aspecte factuale, comportamentale De exemplu, se folosesc exprimări diferite pentru a urmări comportamente („Aţi băut bere în ultimele de ore?”), obiceiuri („Cât de frecvent aţi băut bere în ultima lună?”), intenţii („Aţi cumpăra bere pentru a servi la masă în weekenduri?”), aspecte învăţate („Care este primul lucru care vă vine în minte când vă gândiţi la bere?”), preferinţe („Care este berea care vă place cel mai mult?”) sau atitudini („Care mărci de bere corespund afirmaţiei «este o bere de calitate»?”) (Datculescu, ) În această secţiune ne-am rezumat la prezentarea sondajelor de opinie aplicate transversal Deşi o asemenea strategie este una utilă pentru a descrie starea de fapt existentă la un moment dat, ea suferă de aceeaşi problemă pe care o au şi studiile corelaţionale şi, în general, orice design de cercetare transversal Metoda poate evidenţia gradul de răspândire a unui fenomen (prevalenţa), cât şi eventuale contingenţe existente între anumite variabile, însă nu poate surprinde relaţii de tip cauză-efect Motivul este unul simplu, acela că pentru a surprinde relaţii cauzale una dintre condiţii este aceea de a observa că modificările variabilei-cauză le precedă temporal pe cele ale variabilei-efect, iar acest lucru nu poate fi demonstrat într-un studiu cu o singură testare Pentru a adresa asemenea întrebări într-un context non-experimental, se pot derula sondaje într-un design longitudinal, cum sunt studiile pe cohorte sau cele panel Studiile longitudinale pe cohorte Înainte de a prezenta mai multe detalii despre studiile pe cohorte, se cuvine să facem o serie de precizări terminologice relevante pentru a înţelege avantajele şi dezavantajele studiilor longitudinale în general, nu doar a celor efectuate pe cohorte Apoi vom pune accent pe prezentarea specificului studiului longitudinal pe cohorte, utilizat cu precădere în sfera clinică şi care se apropie foarte mult de zona studiilor panel, utilizate în ştiinţele sociale În sfârşit, în cea de-a treia parte a acestei secţiuni vom prezenta o serie de informaţii practice, utile pentru implementarea şi analiza unor asemenea studii Tipologia studiilor longitudinale şi obiectivele care pot fi adresate Toate tipurile de studii longitudinale se aseamănă prin faptul că cercetătorul culege datele de la participanţii la studiu în mai multe etape diferite, denumite valuri (waves) Diferenţele dintre tipurile de studii longitudinale (reflectate în figura ) sunt discutate în tabelul  Figura Tipuri majore de studii care apelează la un design longitudinal Tabelul Ilustrarea principalelor tipuri de studii longitudinale Tipul de studiu Descrierea caracteristicilor de bază Ilustrare  Studiul tendinţelor (trend study) Aceste studii sunt utile pentru a surprinde direcţia de evoluţie a unui domeniu prin testări repetate Specificul lor constă în faptul că nu sunt testaţi repetat aceiaşi respondenţi, ci în fiecare val de testare se extrage un eşantion aleatoriu din populaţia de interes Pentru a surprinde evoluţia apelului populaţiei la servicii de psihoterapie, se poate urmări anual, timp de zece ani, evoluţia procentului persoanelor care apelează la servicii de psihoterapie În fiecare an se extrage câte un eşantion reprezentativ din populaţia generală şi se stabileşte prevalenţa utilizării acestui serviciu Nu sunt testate aceleaşi persoane, decât din întâmplare Ideea este de a urmări tendinţa de evoluţie a serviciilor de psihoterapie (creşte, stagnează sau scade frecvenţa utilizării lor în populaţie), prin apelul la eşantioane reprezentative extrase din populaţia respectivă, fapt care permite compararea datelor colectate anual  Studiul pe cohortă (cohort study) Sub această denumire identică există două tipuri diferite de studii majore de cohortă Ele se aseamănă prin faptul că ambele apelează la un tip special de eşantion denumit cohortă (participanţi care împărtăşesc una sau mai multe caracteristici comune, de exemplu orfani de mamă înainte de vârsta de ani, crescuţi apoi în familii monoparentale), dar se diferenţiază prin strategia de selectare a participanţilor A Într-un caz, bazat pe tradiţia cercetărilor sociologice, sunt utilizaţi participanţi diferiţi de la un val de testare la altul, dar aparţinând aceleiaşi cohorte (de exemplu, un eşantion reprezentativ de persoane născute în perioada de glorie a comunismului [ - ] este testat în valul , în timp ce în valul , care are loc zece ani mai târziu, este selectat un alt eşantion reprezentativ al aceleiaşi cohorte) În studiile realizate pe cohorte sunt selectate de obicei cel puţin două sau mai multe cohorte diferite, pentru a realiza comparaţii în evoluţia observată între cei aparţinând unei cohorte (de exemplu, născuţi între şi ) şi cei aparţinând unei alte cohorte (de exemplu, născuţi în perioada - ) B În cel de-al doilea caz, având drept sursă sfera medicinei, în mod special a epidemiologiei, sunt utilizaţi aceiaşi participanţi aparţinând unei cohorte, aceştia fiind testaţi în mod repetat, în două sau mai multe valuri De exemplu, dacă se compară cohorta celor născuţi în perioada - , cu cea a celor născuţi în perioada - , sunt colectate  În versiunea cohortelor cu testarea repetată a unor eşantioane similare, dar nu identice (tradiţia din sociologie), pentru a surprinde evoluţia utilizării serviciilor de psihoterapie la nivelul cohortelor de interes, ambele cohorte sunt urmărite anual, timp de zece ani, pentru a evalua frecvenţa apelului la servicii de psihoterapie, precum şi diferenţele existente între cele două cohorte (generaţii) De exemplu, în primul val sunt selectaţi aleatoriu câte de participanţi născuţi în perioada - , respectiv în perioada - , în baza unei eşantionări aleatorii a populaţiei generale cu domiciliul în Timişoara Anul următor sunt extraşi alţi de indivizi născuţi în perioada - , respectiv alţi de participanţi născuţi în perioada - În mod similar se procedează în fiecare an din cei zece supuşi perioadei de urmărire, cu precizarea că nu se are în vedere testarea aceloraşi subiecţi, ci testarea unor indivizi care aparţin cohortei de interes, având în vedere faptul că extragerea eşantionului se face într-un mod aleatoriu, pentru a asigura posibilitatea de a generaliza rezultatele la nivelul cohortei din care fac parte şi a face comparaţii intergeneraţionale În versiunea cohortelor cu testarea repetată a unor eşantioane identice (tradiţia din medicină) pentru surprinderea evoluţiei serviciilor de psihoterapie şi a diferenţelor dintre cohorte, sunt testaţi repetat timp de zece ani, aceiaşi de indivizi ( aparţinând cohortei - şi din cohorta - ) Desigur că şi în cazul acestora, pentru a asigura generalizarea rezultatelor la nivelul populaţiilor de interes, selecţia iniţială se face prin proceduri probabilistice de eşantionare   date de la aceiaşi subiecţi, cele două eşantioane fiind testate repetat pe perioada de urmărire În subtipul cel mai răspândit de studii pe cohortă în tradiţia medicală există o condiţie suplimentară, aceea ca toţi cei de indivizi selectaţi să nu fi avut la momentul iniţial (T ) nicio experienţă anterioară în care să fi apelat la servicii psihoterapeutice Cu alte cuvinte, cele două cohorte comparate să fie similare, cu excepţia criteriului de diferenţiere, pentru a vedea în ce măsură generaţia din care fac parte (dinainte sau de după revoluţia din ) joacă rolul unui factor facilitator sau inhibitor în apelul la servicii de psihoterapie  Studiul panel (panel study) Studiile panel presupun testarea repetată (în două sau mai multe valuri) a aceluiaşi eşantion de persoane selectat iniţial, de preferinţă, tot prin proceduri aleatorii de eşantionare Deşi ideea studiilor panel se apropie foarte mult de ideea studiilor pe cohorte din tradiţia epidemiologiei, există unele diferenţe între ele De exemplu, în studiile panel accentul nu este pus pe compararea cohortelor, ci pe a urmări evoluţia în timp a aceloraşi indivizi incluşi în studiu De asemenea, ideea unor criterii de eligibilitate, prezentă atât de frecvent în studiile de cohortă (de exemplu, să nu fi apelat anterior la servicii de psihoterapie), nu are o însemnătate la fel de mare în studiile panel Pentru a surprinde evoluţia apelului populaţiei la servicii de psihoterapie se poate urmări anual, timp de zece ani, evoluţia procentului persoanelor care apelează la servicii de psihoterapie Cu ocazia primului val (primul an) se extrage un eşantion reprezentativ din populaţia generală şi se stabileşte prevalenţa utilizării acestui serviciu Apoi este urmărită evoluţia aceloraşi subiecţi timp de zece ani, astfel încât fiecare persoană inclusă în studiu este testată anual, în zece valuri succesive  Diferenţele dintre cele patru forme majore de studii longitudinale sunt importante din perspectiva obiectivelor urmărite Astfel, deşi studierea tendinţelor este cel mai uşor de implementat (pentru că nu trebuie urmărite aceleaşi persoane şi nici nu trebuie avută o grijă deosebită în selectarea participanţilor după anumite criterii), ea nu permite adresarea unor întrebări de tip cauză-efect, deoarece nu se urmăreşte evoluţia în timp a aceloraşi persoane, ci mai degrabă o tendinţă generală de evoluţie a lucrurilor Mai mult, uneori această tendinţă generală poate ascunde rezultate interesante care ar putea fi observate doar printr-o abordare diferenţiată, de genul studiilor de cohortă (vezi exemplul ipotetic descris în figura ) De exemplu, în cazul unui studiu al tendinţelor privind consumul de droguri uşoare precum canabisul, se constată o relativă stagnare a prevalenţei consumului în jurul unei medii de , % consumatori din cadrul populaţiei generale investigate Această stagnare poate ascunde însă tendinţe diferite (unele de creştere, altele de descreştere, anulându-se reciproc), dacă ne raportăm la aceleaşi rezultate (o medie generală de , %) obţinute pe trei cohorte diferite (trei generaţii care aveau vârste medii de , , respectiv de ani la data demarării studiului în ) Astfel, se observă că spre deosebire de cei care fac parte din cohorta - , la care se observă o prevalenţă a consumului de canabis în jurul a %, generaţiile - , respectiv - ating în medie o prevalenţă de peste % la aceeaşi vârstă de de ani, semnal care ar putea fi interpretat ca o creştere a consumului de droguri la generaţiile mai noi Acest lucru este reflectat şi prin compararea consumului de droguri la de ani între cohorta din anii - (în jurul a % din respondenţi) şi cohorta din anii - (în jurul a % dintre respondenţi) De asemenea, se constată o descreştere a consumului de canabis după împlinirea vârstei de de ani la ambele cohorte la care s-au colectat date după împlinirea acestei vârste Toate aceste nuanţe nu ar fi putut fi surprinse printr-o simplă analiză globală a tendinţei, ele fiind puse în lumină numai printr-o abordare diferenţială, de comparare a evoluţiei diferitelor cohorte evaluate  Figura Rezultate ipotetice ale unui studiu despre consumul de droguri: studiu al tendinţelor (partea stângă) vs studiu pe trei cohorte generaţionale (partea dreaptă) Informaţii suplimentare despre specificul fiecărui tip de studii longitudinale pot rezulta şi din analiza obiectivelor ce pot fi studiate prin apelul la studii longitudinale (vezi tabelul ) Tabelul Relaţia dintre obiectivele studiului şi tipurile de studii longitudinale Obiective Descriere (tip de studiu adecvat)   Detectarea modificărilor în timp şi patternul acestora  A Identificarea schimbărilor şi a formei acestora (liniară, exponenţială etc ) Ilustrare: Se modifică satisfacţia studenţilor de la UVT faţă de programele educaţionale oferite? (T) B Identificarea diferenţiată a schimbărilor (schimbarea este aceeaşi pentru toţi indivizii sau există schimbări diferite în funcţie de anumite caracteristici ale studenţilor?) Ilustrare: Se modifică diferit satisfacţia studenţilor din cohorta celor finanţaţi de la bugetul de stat faţă de cea a studenţilor plătitori de taxă? (C ) C Analiza relaţiilor dintre schimbările observate (dacă anumite schimbări observate sunt asociate cu alte modificări – schimbări reciproce) Ilustrare: Schimbările în atitudinea adolescenţilor faţă de consumul de alcool sunt asociate cu modificări în atitudinea lor faţă de fumat? (T) D Analiza diferenţială a relaţiilor dintre schimbările observate (dacă există diferenţe interindividuale în intensitatea asocierii anumitor schimbări) Ilustrare: În cazul fumătorilor, modificarea atitudinii faţă de consumul de tutun este asociată cu modificarea atitudinii faţă de consumul de cafea, în timp ce în cazul nefumătorilor nu există o asociere între magnitudinea modificării uneia dintre ele şi schimbarea celeilalte (C ) E Identificarea numărului de cazuri noi (incidenţa unei probleme) Ilustrare: Care este incidenţa anuală a consumului de droguri la adolescenţi? (C sau P)   Indicarea direcţiei şi a magnitudinii unei relaţii de tip cauzal  A Identificarea unor variabile-cauză (a unor determinanţi/factori antecedenţi) responsabile pentru o anumită schimbare apărută (de ce se schimbă indivizii?) Ilustrare: Burnout-ul este un factor favorizant al absenteismului (C sau P) B Analiza diferenţială a impactului variabil al factorilor antecedenţi asupra comportamentului sau atitudinii urmărite (de ce efectul variabilei cauză asupra efectului este diferit la anumiţi indivizi faţă de alţii?) Ilustrarea: O analiză a rolului moderator al schimbării organizaţionale (angajaţi din companii cu acţionariat nou vs angajaţi din companii cu acelaşi acţionariat) în relaţia dintre burnout ca un prezumtiv factor favorizant şi absenteism (C )  Legendă: T – studiu al tendinţelor; C – studiu pe cohorte cu eşantioane similare; C – studiu pe cohorte cu eşantioane identice; P – studiu panel Tabelul poate fi privit în sistem piramidal De exemplu, studiile de tip panel pot fi oricând utilizate în locul celor de tendinţă pentru a surprinde obiectivele mai puţin pretenţioase De asemenea, studiile pe cohorte efectuate pe eşantioane identice (C ) pot înlocui studiile de acelaşi gen bazate pe eşantioane similare (C ) Însă aspectele A- D ale primului obiectiv pot fi adresate şi prin studii longitudinale uşor de implementat, deoarece nu apelează la testarea aceloraşi participanţi (studiile T şi C ) Aceste studii se apropie mai mult de ideea studiilor transversale, nefiind vorba de testări repetate realizate pe aceeaşi participanţi De aceea, ele sunt utile pentru a sesiza patternuri de asociere (patternuri ale modificărilor în timp ale variabilelor de interes), chiar dacă nu permit inferarea unor afirmaţii privind relaţiile cauză-efect Studiile pe cohorte (cu eşantion identic) Aşa cum rezultă din tabelul şi din explicaţiile însoţitoare acestuia, acest tip de studii poate fi utilizat, în principiu, pentru a răspunde la oricare dintre întrebările tipice întâlnite într-un studiu longitudinal, cu precizarea că este foarte util mai ales în situaţiile în care se urmăresc obiective de tip cauzal-descriptiv De asemenea, acest tip de studii este cel mai întâlnit tip de studii longitudinale în domeniul clinic (medical), fiind cel mai utilizat design longitudinal din sfera psihologiei clinice, cea mai răspândită ramură aplicativă a psihologiei Din aceste motive, am ales să prezentăm în secţiunea de faţă mai multe detalii caracteristice despre această strategie de cercetare Prin cohortă se înţelege un grup de persoane care împărtăşesc aceeaşi caracteristică într-o anumită perioadă de timp (cum ar fi cei născuţi în acelaşi an, cei care au absolvit un program masteral în străinătate, cei care provin dintr-o anumită etnie, fumătorii, primii născuţi într-o familie etc ) Cohorta poate fi comparată cu situaţia generală din populaţia din care a fost extrasă sau cu un alt grup de control comparativ (de exemplu, cohorta fumătorilor este comparată cu un grup similar sociodemografic, dar compus din nefumători) În practică este aproape imposibil ca toate variabilele potenţial confundate să fie controlate într-un design non-experimental, dar cu toate acestea se obişnuieşte să se colecteze, în afara variabilei principale de interes, date despre evoluţia altor variabile potenţial confundate, pentru a controla prin mijloace statistice impactul acestora asupra criteriului urmărit De exemplu, într-un studiu efectuat de Kempainnen et al ( ) privind efectul ordinii născuţilor (primii născuţi, ultimii născuţi, cei singuri la părinţi, altă situaţie) asupra apariţiei schizofreniei, s-au măsurat şi controlat aspecte precum: (a) complicaţii perinatale prezente sau absente; (b) sarcină dorită vs nedorită; (c) numărul de fraţi şi surori; (d) tipul de familie la vârsta de ani (monoparentală vs normală) Figura ilustrează exemplul tipic de design longitudinal întâlnit în studiile pe cohorte prospective, într-un studiu care urmăreşte să vadă măsura în care consumul excesiv de alcool este un antecedent al infracţionalităţii De exemplu, din cadrul unei populaţii generale de adolescenţi se extrage un eşantion probabilistic cu un număr mare de participanţi (de exemplu, N = ), care îndeplinesc următoarele două condiţii de eligibilitate pentru a intra în studiu: (a) au vârsta de ani împlinită, respectiv (b) nu au în istoricul lor personal nicio problemă cu legea înregistrată în evidenţele poliţiei Tuturor celor care îndeplinesc aceste două condiţii de eligibilitate li se aplică un test de screening privind dependenţa de alcool din care este selectat un grup de persoane care prezintă un risc crescut de dependenţă de alcool (percentilul sau peste) (N = ) şi un grup de control similar ca volum, extras randomizat din restul de % de participanţi selectaţi iniţial, dar având scoruri percentile sub la testul de screening privind dependenţa de alcool Apoi, cele două loturi selecţionate special sunt urmărite timp de zece ani, fiind înregistrate măsurători obiective ale încălcărilor legii (existenţa unor contravenţii, respectiv a unor infracţiuni) după , respectiv după ani de la începutul derulării studiului  Figura Schema logică a unui studiu de cohortă prospectiv Datele colectate în cadrul unui studiu de cohortă nu se referă numai la prezumtivul factor cauzal (de risc) şi la efectul urmărit, ci este obligatoriu să se aibă în vedere colectarea datelor cu referire la unele variabile confundate Dacă ar fi să facem referire la exemplul ilustrat în figura , ar fi prematur să afirmăm că dependenţa de alcool ar contribui la creşterea infracţionalităţii (în contextul în care s-ar constata că adolescenţii identificaţi ca fiind dependenţi de alcool cu ocazia screeningului comit mai multe infracţiuni decât adolescenţii din grupul de control) În schimb, ar fi valid să afirmăm că alcoolul este un predictor al stării infracţionale viitoare Pentru a încerca să emitem inferenţe de tip cauzal, ar fi bine să măsurăm, pe lângă problematica alcoolului, nivelul altor variabile posibil confundate precum: (a) stilul parental – cunoscându-se, de exemplu, o asociere între consumul excesiv de alcool şi un stil parental laissez-faire; (b) consumul de droguri, asociat adesea cu consumul excesiv de alcool; (c) nivelul de educaţie; (d) statutul social economic; (e) tendinţele antisociale măsurate printr-o scală din zona psihopatologiei etc ) Dacă după ajustarea rezultatelor, ţinând cont de efectul acestor variabile confundate, vom găsi în continuare că alcoolul reprezintă un factor de risc pentru săvârşirea de infracţiuni, vom putea fi ceva mai încrezători că dependenţa de alcool ar putea fi o posibilă cauză pentru infracţionalitate În schimb, dacă după ajustarea rezultatelor, prin luarea în considerare a impactului variabilelor potenţial confundate măsurate, consumul excesiv de alcool nu mai are un impact semnificativ statistic asupra comportamentului infracţional al tinerilor, vom putea afirma, cu o probabilitate destul de mare, că alcoolul nu reprezintă un factor cauzal, ci, asemenea săvârşirii de infracţiuni, consumul diferenţiat de alcool este doar un efect al unei alte variabile confundate De exemplu, din analiza datelor ar fi posibil ca un stil parental laissez-faire să fie un antecedent cauzal atât pentru dependenţa de substanţe (inclusiv alcool), cât şi pentru apariţia unor conduite din zona infracţionalităţii Mai multe detalii despre situaţia în care putem emite afirmaţii de tip cauzal în baza unui studiu longitudinal de tip cohortă se regăsesc în tabelul de mai jos Tabelul Ghidul Bradford-Hill cu privire la interpretarea într-o manieră cauzală a rezultatelor din studiile longitudinale pe cohorte (adaptare după Bruce, Pope şi Stanistreet, ) Criteriu cauzal (necesar) Explicare şi ilustrare  Factorul potenţial (expus) precedă efectul Principiul de bază în orice relaţie de tip cauză-efect este acela că factorul-cauză precedă temporal apariţia efectului De exemplu, de la momentul expunerii la radiaţii este nevoie de câţiva ani până la apariţia leucemiei Studiile pe cohortă pot compara un lot de persoane sănătoase, dintre care unii au fost expuşi la radiaţii (din zona Cernobîl) cu un lot similar, dar neexpus la radiaţii  Intensitatea asocierii Pe măsură ce intensitatea asocierii este una mai puternică, cu atât mai mare este probabilitatea de a fi în faţa unei relaţii de tip cauzal, deoarece oricâte ajustări ar fi determinate de factori potenţial confundaţi, tot nu ar putea elimina asocierea observată Un exemplu este relaţia puternică dintre fumat şi cancer, în care riscul relativ are o valoare de aproximativ (fumătorii prezintă un risc de ori mai mare de a face cancer decât nefumătorii)  Menţinerea relaţiei independent de efectul variabilelor confundate Este important să se demonstreze faptul că relaţia rămâne în picioare, chiar dacă am controlat statistic influenţa altor factori relevanţi măsuraţi Din păcate, la acest capitol, rămâne dezavantajul major al studiilor non-experimentale, spre deosebire de cele experimentale, de a nu putea controla toate sursele cauzale posibile  Consistenţă la nivel de doză (expunere diferită) De exemplu, într-un studiu care urmăreşte impactul evenimentelor cu potenţial emoţional traumatic asupra apariţiei anxietăţii generalizate, acest criteriu este îndeplinit dacă se observă o incidenţă mai mare a anxietăţii generalizate la cei cu un istoric cu multiple stări traumatice (cum ar fi pierderea unui părinte; abuzul fizic; observarea unei situaţii de criză – incendierea casei etc ), decât în cazul celor care au fost expuşi doar la un singur eveniment cu potenţial traumatic major  Consistenţă din studii şi populaţii diferite Nivelul de încredere în ideea unei relaţii de tip cauză-efect provenită din studii non-experimentale longitudinale creşte dacă rezultatul este concordant cu cele provenite din alte studii  Plauzibilitate Ar fi destul de riscant să se afirme despre o asociere identificată că ar avea o natură cauzală dacă nu există un suport empiric şi teoretic pentru aceasta În exemplul oferit, ar fi destul de greu de argumentat că excesul de alcool ar fi cauza directă a conduitei infracţionale viitoare, deşi s-ar putea argumenta că reprezintă un factor cauzal distal (consumul excesiv de alcool duce la destructurarea capacităţii de adaptare la cerinţele societăţii, ceea ce poate deschide calea comportamentelor infracţionale, ca modalitate de coping la inadaptarea socială şi la neajunsurile financiare)  Avantajul major al studiilor longitudinale efectuate pe acelaşi eşantion, cum sunt studiile pe cohortă cu design puternic şi studiile panel, este acela de a putea decela mai bine care dintre variabile ar putea fi variabile-cauză şi care sunt variabile-efect De exemplu, în studiile corelaţionale transversale în care se observă o relaţie negativă între depresie şi stimă de sine este imposibil de stabilit dacă în urma intensificării simptomatologiei depresive apar modificări în direcţia scăderii stimei de sine sau dacă persoanele cu stimă de sine scăzută sunt mai vulnerabile/predispuse să ajungă la manifestări depresive În mod similar, într-un studiu transversal care indică o asociere între expunerea la material video violent şi comportamentul agresiv, nu se poate stabili clar dacă: (a) persoanele agresive preferă mai degrabă să urmărească material ce conţine scene violente sau (b) dacă acestea activează un nivel crescut de agresivitate la cei care vizionează materialul respectiv sau (c) dacă între cele două aspecte există o condiţionare reciprocă Prin studiile longitudinale ce implică măsurători efectuate pe aceeaşi indivizi se poate stabili clar care dintre variabilele analizate apare mai întâi Un alt avantaj important al studiilor pe cohorte este posibilitatea de a evidenţia impactul pe care îl are un anumit factor de risc (de exemplu, fumatul) asupra unor efecte multiple (cancer, boli cardiovasculare, greutatea corporală, rezistenţa fizică etc ), cu menţiunea că autorii acestor studii trebuie să adopte un comportament etic (cum ar fi evitarea tendinţei de a raporta rezultatele într-un mod trunchiat, precum doar cele semnificative, din multitudinea de date colectate) (Grimes şi Schulz, ) Cu toate aceste avantaje şi plusuri sesizate în cazul studiilor pe cohorte, întrebarea naturală ar fi „de ce sunt ele mai rar întâlnite în domeniul psihologiei?” Principalul motiv este unul de ordin economic Realizarea unui asemenea studiu necesită resurse uriaşe atât din perspectiva numărului de participanţi incluşi în studiu (cu care trebuie să se păstreze legătura pentru a fi evaluaţi periodic şi pentru a reduce pierderea participanţilor ), cât şi din punct de vedere al resursei de timp (în special în cazul studiilor prospective, în care trebuie să treacă un număr de ani de la momentul T până la momentul finalizării studiului) La acestea se adaugă complexitatea şi durata evaluărilor efectuate, fiind măsurate pe lângă variabilele de interes (posibila relaţie cauzală urmărită), multiple variabile potenţial confundate care trebuie măsurate pentru a fi controlate statistic Astfel, urmărirea a de persoane timp de de ani, pentru a sesiza valoarea predictivă pe care stilul de ataşament format în copilăria timpurie îl are asupra comportamentului ulterior al individului în relaţiile sale romantice, nu este un demers uşor de realizat, iar fondurile disponibile pentru acest gen de studii sunt mult mai dificil de găsit comparativ cu situaţia existentă în alte domenii, cum este cel al medicinei Caseta Alte detalii de luat în seamă în planificarea unui studiu pe cohorte (Grimes şi Schulz, ; WHO, ) Criterii clare pentru ce înseamnă grupul expus vs neexpus, precum şi pentru efectele urmărite (distorsiune în selecţie şi în măsurare) De exemplu, într-un studiu în care s-ar urmări efectul consumului de tutun asupra evoluţiei IQ-ului (degradării cognitive) este foarte important să se definească ce înseamnă să consume tutun În cazul în care se formează mai multe grupe (consum accentuat, consum moderat, consum absent) este important să se definească foarte clar ce înseamnă acest lucru De exemplu, în cazul consumului accentuat ar putea fi pus drept criteriu de includere ca participanţii să fumeze de cel puţin luni de zile, cel puţin de ţigări pe zi, pornind de la un standard de mg de gudron, , mg de nicotină şi mg de monoxid de carbon Apoi trebuie avute criterii clare (inclusiv la nivelul extinderii volumului cohortelor pentru a menţine o putere statistică acceptabilă) pentru cazurile de încrucişare – indivizi iniţial nefumători care devin fumători înrăiţi sau persoane cuprinse iniţial în grupul fumătorilor înrăiţi care se lasă de fumat ulterior În mod similar ar trebui operaţionalizat clar ce se înţelege prin degradarea cognitivă (de exemplu, scăderi în nivelul IQ dincolo de valoarea unui index al modificării reale – vezi tabelul din capitolul ) Dincolo de pragurile valorice stabilite este importantă şi metoda de colectare a datelor, cele mai bune fiind socotite metodele obiective, iar cele mai puţin dorite fiind cele bazate pe autoraportare Problema încrederii în datele obţinute se pune mai ales în cazul studiilor pe cohorte retrospective, deoarece este destul de greu de apreciat corectitudinea datelor obţinute din trecut Selectarea adecvată a unui grup de control (distorsiune în selecţie) Ideal ar fi ca grupul de control selectat să fie unul care să manifeste caracteristici similare cu cohorta de interes De exemplu, într-un studiu ipotetic care să compare efectul ordinii de naştere dintr-o familie (primii născuţi vs ultimii născuţi) asupra apariţiei unui tulburări de personalitate, cel mai potrivit ar fi ca cele două grupuri să fie alcătuite în pereche, din cadrul aceleiaşi familii, pentru că astfel se controlează din start o multitudine de variabile precum nivelul de educaţie al părinţilor, stilul parental, mediul cultural, tipul de şcoală urmată etc ) Dacă studiul urmărit nu permite utilizarea unor grupuri de control interne, alternativa ar fi aceea de a selecta un eşantion reprezentativ din populaţia generală care corespunde criteriilor respective Acesta poate fi păstrat intact, aşa cum a fost el selectat prin tehnici de eşantionare probabilistică (cu avantajul de a păstra cel mai bine caracteristicile generale ale populaţiei de interes) sau poate fi modificat (se pot selecta subeşantioane cu un nivel ridicat de similaritate pe baza unor algoritmi cum este scorul compozit de propensitate descris în cadrul secţiunii ) (cu avantajul de a avea un nivel sporit de similaritate cu grupul-ţintă) De altfel, unul dintre aspectele obligatorii de prezentat în orice studiu pe cohorte este o descriere a caracteristicilor demografice şi referitoare la variabile potenţial confundate a loturilor comparate, astfel încât să se observe echivalenţa acestora la momentul iniţial Analiza cazurilor lipsă (a participanţilor pierduţi) (distorsiuni cauzate de pierderea participanţilor) Dacă procentul de pierdere a participanţilor din studiile longitudinale ia valori scăzute (de exemplu, până în %) nu sunt afectate fundamental rezultatele studiului, deşi pe măsură ce procentul de pierdere creşte, scade capacitatea de generalizare a rezultatelor la populaţia din care a fost extrasă cohorta Ar fi însă de interes să se analizeze profilul persoanelor care au renunţat şi în ce măsură acest lucru nu ar distorsiona rezultatele (de exemplu, dacă majoritatea celor care au fost pierduţi din studiu aparţin grupului persoanelor dependente de alcool, se poate ca efectul alcoolului asupra comportamentului infracţional să fie subevaluat) Includerea şi măsurarea adecvată a variabilelor confundate (distorsiuni cauzate de problema variabilei terţe) Includerea variabilelor potenţial confundate ar trebui făcută în baza unei analize atente a literaturii de specialitate, etapă premergătoare celei de iniţiere a studiului de colectare a datelor iniţiale La acest nivel contează atât includerea tuturor variabilelor relevante, cât şi găsirea unor modalităţi adecvate de măsurare a acestora Aspecte statistice specifice în studiile de cohortă Spre deosebire de celelalte tipuri de studii, bazate pe tehnici statistice de testare a ipotezelor (cu rezultate semnificative statistic la un p % albi B > % afroamericani C > % hispanici D eşantion mixt (nicio rasă nu depăşeşte %)   Cursanţi bărbaţi (%):    Tipul cursanţilor A normali B delincvenţi C cu cerinţe educative speciale (handicap) D cu cerinţe educative speciale (supradotaţi)  Secţiunea C: DESIGN   Tipul studiului A Non-experimental B Experimental C Cvasiexperimental cu pretest D Cvasiexperimental cu pretest, dar fără echivalenţa rezultatelor E Cvasiexperimental fără pretest F Neclar (nu se specifică dacă există randomizarea participanţilor)   Nivelul randomizării A Individual B La nivel de clasă/grup (cluster)   Tipul grupului de control A Instruire clasică (faţă în faţă) B Instruire online (alt model)  C Absent   Nivel de retragere a participanţilor A Sub % B Între şi %  C peste %   Evaluarea globală a designului A Risc scăzut de distorsiune B Risc ridicat de distorsiune  C Informaţii neclare/insuficiente  Secţiunea D: CARACTERISTICI ALE VARIABILEI INDEPENDENTE   Intervenţia A Instruire online (exclusivă) B Instruire mixtă online + faţă în faţă (blended learning)   Stilul învăţare solicitat A Pasiv (expozitiv) B Activ  C Interactiv   Derularea cursului online A Sincron B Asincron   Tipul cursului A Voluntar (intrinsec) B Obligatoriu de urmat (consecinţe, motivaţie extrinsecă)   Durata cursului A sub ore (volum de muncă) B între şi de ore C între şi de ore D între şi de ore E între şi de ore F peste de ore   Conţinutul vizat A Ştiinţe exacte şi ale vieţii B Ştiinţe sociale C Ştiinţe umaniste/artă D Mixt   Interacţiunea cu alţi colegi A Posibilă faţă în faţă B Posibilă online C Posibilă mixt  D Absentă E Nespecificată  Secţiunea E: ELIGIBILITATEA VARIABILEI DEPENDENTE   Tipul de rezultat vizat A Notă şcolară (scor test) B Nivelul de abandon al cursului C Portofoliu de activităţi  C Atitudine/preferinţă pentru subiectul studiat D Alt tip Care?  Suplimentar faţă de codarea datelor la nivelul studiului, de multe ori este nevoie de o codare a informaţiilor colectate din studii la nivelul variabilei dependente Acest lucru este deseori util pentru că pot fi colectaţi mai mulţi indicatori ai variabilei dependente, care vor trebui reuniţi ulterior într-un singur indicator compozit per studiu, pentru a nu încălca condiţia de independenţă a datelor colectate De exemplu, dacă într-un studiu au fost colectate rezultate de la acelaşi eşantion de subiecţi cu privire la performanţele şcolare de la trei discipline (matematică, psihologie şi limba germană), acestea vor fi ulterior însumate într-un singur indicator compozit, dacă analiza realizată vizează eficienţa instruirii online în general, însă vom lua în considerare indicatorul adecvat (de exemplu, rezultatul la matematică) dacă vom analiza eficienţa instruirii online în predarea disciplinelor din domeniul ştiinţelor exacte De aceea, pentru a putea permite asemenea diferenţieri, pe lângă codarea studiilor ce reprezintă un nivel ierarhic superior de analiză se recomandă codarea separată a indicatorilor de mărime a efectului pentru fiecare variabilă dependentă măsurată Această codare separată vizează însă doar studiile declarate eligibile Caseta Un exemplu ipotetic de chestionar utilizat (codarea mărimii efectului) Secţiunea A: IDENTIFICATORI   ID Studiu:    ID Mărimea efectului (ES):   Secţiunea B: CARACTERISTICI ALE VARIABILEI DEPENDENTE   Nivelul comparaţiei ES A Comparaţie pretest B Comparaţie posttest  C Comparaţie follow-up   Conţinutul disciplinei A Ştiinţe exacte şi ale vieţii B Ştiinţe sociale C Ştiinţe umaniste/artă D Mixt   Sarcina evaluării notei A Test grilă B Proiect/Referat C Portofoliu mixt D Alta Care?  Secţiunea C: CALCULAREA MĂRIMII EFECTULUI   Tip de date disponibile A Medii, abateri standard, n grupe B F/t şi n grupe/grade de libertate C Hi pătrat D Frecvenţe E Valoarea exactă a pragului de semnificaţie F Alte cazuri   Pagina cu datele articolului:    Direcţia rezultatului A Online > control    n coloane necesare calcul   (De exemplu, consultând caseta , în cazul diferenţelor între medii avem nevoie de valorile m, s şi n pentru grupul online, respectiv pentru grupul de control, ceea ce presupun adăugarea a şase coloane suplimentare; totuşi, mărimea efectului poate fi estimată şi pe baza altor formule, situaţie în care sunt introduse coloane suplimentare, în funcţie de datele disponibile )   Metaanaliza Calcularea indicatorilor de mărime a efectului În privinţa modului de calcul a indicatorilor de mărime a efectului există foarte multe surse bibliografice utile, cele recomandate fiind îndeosebi lucrările realizate de Borenstein et al ( ), Borenstein, Hedges, Higgins şi Rothstein ( ), Hunter şi Schmidt ( / ) sau Lipsey şi Wilson ( ) De asemenea, astăzi sunt disponibile o serie de programe statistice specializate pentru calculul indicatorilor de mărime a efectului, precum Comprehensive MetaAnalysis (Borenstein et al , ), RevMan (Cochrane Collaboration, ), precum şi aplicaţii specifice gratuite în programe generale precum Microsoft Excel (DeCoster, ), dar şi aplicaţii de sine stătătoare (de exemplu, Becker, ; Lyons şi Morris, ) Indiferent de sursa utilizată pentru demersul metaanalitic, se poate considera că există două mari perspective de lucru: cea propusă de Hunter şi Schmidt ( / ), respectiv cea propusă de Borenstein et al ( ) Primii sunt autorii unui demers denumit metaanaliza psihometrică sau metaanaliza componentelor esenţiale (bare bones metaanalysis), viziunea lor fiind mai frecvent utilizată în psihologia organizaţională şi în cea a personalităţii, îndeosebi pentru studii de tip corelaţional Cea de-a doua propunere vine din zona ştiinţelor medicale, având un impact mai ridicat în psihologie clinică, psihoterapie, psihologie educaţională, contexte în care demersurile comparative sunt întâlnite mai frecvent Opţiunea noastră pentru acest capitol este pentru modelul propus de Borenstein et al ( ), din următoarele raţiuni: (a) modelul are un impact major asupra dezvoltării domeniului psihologiei clinice şi psihoterapiei prin implicarea în alte proiecte precum Ghidul Cochrane de evaluare sistematică a intervenţiilor (Higgins şi Green, ), în contextul în care psihologia clinică este cea mai extinsă specializare a psihologiei la nivel mondial; (b) modelul este însoţit de un software uşor de utilizat, ceea ce elimină o parte tehnică însemnată, scutindu-i pe cei interesaţi de realizarea metaanalizelor de povara calculului statistic asociat demersului metaanalitic; mai mult, la dezvoltarea acestui software au colaborat cei mai mulţi autori cu contribuţii însemnate în dezvoltarea şi popularizarea domeniul metaanalizei ; (c) oferă o viziune mai realistă de abordare a cazurilor în care se constată efecte eterogene; (d) constituie o abordare nouă în literatura de specialitate din România, spre deosebire de modelul propus de Hunter şi Schmidt pentru care există deja surse bibliografice relevante (vezi metaanaliza corelaţiilor, în Maricuţoiu, ) Deşi accentul este pus pe consideraţiile practice ale utilizării procedurilor metaanalitice propuse de Borenstein et al ( ), vom oferi şi formulele de calcul necesare pentru demersul metaanalitic, în cazul în care nu se apelează la un software specializat În caseta sunt prezentate formulele necesare pentru trei cazuri diferite întâlnite în metaanalize: (a) compararea mediilor; (b) compararea frecvenţelor; (c) metaanaliza corelaţiilor Caseta Calcularea mărimii efectului după Borenstein et al ( ) A Cazul comparaţiilor dintre două medii (t independent sau F având primul df = )  mE, mC media grupului experimental, respectiv media grupului de control  sE, sC abaterea standard din grupul experimental, respectiv cea din grupul de control  nE, nC numărul de participanţi din grupul experimental, respectiv cel din grupul de control  t, r, N valorile testelor t student (grupe independente); r – coeficientul de corelaţie liniară Bravais-Pearson; N – numărul total de participanţi  d, vd, SEd mărimea efectului (d Cohen); dispersia mărimii efectului (vd); eroarea standard a mărimii efectului (SEd)  g, vg, SEg mărimea efectului ajustată (g Hedges); dispersia mărimii efectului ajustate (vg); eroarea standard a mărimii efectului ajustate (SEg)  w ponderea unui studiu în calculul mediei ponderate a mărimii efectului (valabilă pentru efecte fixe)  sau                   B Cazul studiilor corelaţionale (r Bravais-Pearson)  r, N valoarea coeficientului de corelaţie (r); volumul eşantionului  z, vz, SEz mărimea efectului (calcul intermediar) (Z); dispersia mărimii efectului (vz); eroarea standard a mărimii efectului (SEz)  w ponderea unui studiu în calculul mediei ponderate a mărimii efectului (valabilă pentru efect fixe)  vs           C Cazul comparaţiilor dintre frecvenţe (hi pătrat având df = )  A, B, C, D frecvenţe observate în cele două loturi comparate: grupul experimental (A – număr de indivizi sănătoşi; B – număr de indivizi nerecuperaţi) şi grupul de control (C – număr de indivizi sănătoşi; D – număr de indivizi nerecuperaţi)  ln OR, vln OR, SEln OR logaritm natural din raportul şanselor (mărimea efectului, calcul intermediar) (lnOR); dispersia mărimii efectului (VlnOR); eroarea standard a mărimii efectului (SElnOR)  Ď€, Ď‡², d pi (valoarea matematică – , ); valoarea hi pătrat pentru un grad de libertate (df = ); mărimea efectului d al lui Cohen  w ponderea unui studiu în calculul mediei ponderate a mărimii efectului (valabilă pentru efecte fixe)  sau               Observaţie! Unii autori utilizează notaţii inverse De pildă DeCoster ( ), autorul Stat Help ce conţine un set de aplicaţii Excel gratuite, disponibile online pentru calculul metaanalitic, notează cu g indicatorul propus de Cohen şi cu d pe cel propus de Hedges Noi am păstrat notaţiile d Cohen şi g Hedges pentru că sunt cele mai răspândite Consideraţii practice privind calculul mărimii efectului Cele mai întâlnite modalităţi de exprimare a mărimii efectului atunci când rezultatele reprezintă comparaţia dintre două medii (grup experimental vs grup de control) sunt indicatorii d Cohen şi g Hedges Ultimul ajustează valoarea lui d, deoarece aceasta tinde să fie supraestimată în cazul comparării unor grupuri cu un număr redus de participanţi incluşi în fiecare Diferenţele dintre valorile celor doi indicatori sunt de cca , De exemplu, în cazul unei mărimi a efectului d = , , g ia valoarea , pentru cazul comparării a două grupe cu câte de participanţi, respectiv valoarea , pentru cazul comparării a două grupe cu câte de participanţi Pentru a calcula mărimea efectului în contextul comparării mediilor a două grupe, este suficient să cunoaştem valorile mediilor, ale abaterilor standard şi ale numărului de persoane cuprinse în fiecare dintre cele două grupe În absenţa acestor informaţii, mărimea efectului poate fi estimată dacă se cunoaşte valoarea lui t student rezultată din compararea celor două grupe, precum şi numărul de indivizi cuprinşi în cele două grupe Totuşi, există o diferenţă între calcularea directă a mărimii efectului pe bază de medii, abateri standard şi număr de subiecţi faţă de estimarea indirectă a mărimii efectului pe bază de t şi N, metoda directă fiind mai exactă De asemenea, în designuri complexe ce necesită aplicarea tehnicilor ANOVA, valorile F constituie doar aproximări ale mărimii efectului Deşi mărimea efectului ar putea fi estimată pe baza lui F (deoarece F = t²), indicatorii respectivi nu ar trebui utilizaţi în calculul metaanalizei din următoarele motive Dacă designul este unul unifactorial (comparaţia dintre trei sau mai multe grupe), valoarea lui F indică un test general De exemplu, dacă se compară eficienţa terapiei cognitiv-comportamentale (TCC) vs terapie familial-sistemică (TFS) vs medicaţie (M), ultima aleasă ca tratament standard, valoarea F nu reflectă specific relaţia dintre o intervenţie anume (TCC) şi grupul de control (M), ci reprezintă un rezultat mixt al comparării simultane a celor trei grupe Astfel, F nu reprezintă doar comparaţia de interes pentru metaanaliză (de exemplu, între TCC şi M), ci reprezintă o valoare agregată, fiind dependentă şi de comparaţiile dintre TCC şi TFS, respectiv dintre TFS şi M Probleme privind valoarea lui F ca input în calculul mărimii efectului apar şi în cazul unor designuri factoriale cu doar două grupe de comparat per factor (de exemplu, × ) De exemplu, într-un studiu cu design intergrup × , cei doi factori, terapie (TCC prezent vs absent), medicaţie (prezent vs absent), vor oferi trei valori F reprezentând efectul principal al terapiei, efectul principal al medicaţiei şi efectul interacţiunii dintre acestea Chiar dacă valoarea lui F terapie ar reflecta direct efectul terapiei asupra simptomatologiei depresive prin compararea rezultatelor celor care urmează şedinţe de terapie cu ale celor care nu urmează aceste şedinţe, valoarea lui F pentru variabila independentă de interes (TCC) este dependentă de valorile celorlalte două valori F calculate (F pentru medicaţie şi F pentru efectul de interacţiune) Acest lucru apare deoarece orice valoare F reprezintă raportul dintre dispersia explicată şi dispersia rămasă neexplicată după ce au fost luate în calcul şi alte variabile, cum ar fi efectul medicaţiei sau efectul interacţiunii dintre terapie şi medicaţie Per ansamblu, valoarea lui F (de exemplu, F pentru TCC) este dependentă de designul utilizat, tinzând să ia valori mai mari în contextul unui design cu măsurători repetate decât în cazul unui design intergrup, precum şi în contextul în care alte variabile implicate (medicaţia şi factorul de interacţiune) explică un procent mai mare din dispersia iniţial neexplicată O excepţie care permite utilizarea lui F pentru calculul adecvat al mărimii efectului pentru compararea evoluţiei a două grupe într-un design ANOVA este aceea a prezentării tabelului sumar ANOVA, situaţie în care F asociat comparaţiei de interes ar putea fi recalculat prin adăugarea dispersiei explicate de alţi factori la dispersia rămasă neexplicată O altă posibilitate ar fi utilizarea rezultatelor (valorile t) obţinute la comparaţiile post hoc sau la testele de contrast ce vizează comparaţia de interes (de exemplu, TCC vs medicaţia) În sfârşit, o altă posibilitate de lucru pentru cazul unui F asociat comparării dintre două grupe obţinut într-un design complex, ar fi ajustarea mărimii efectului în funcţie de designul utilizat (vezi indicatorul eta pătrat generalizat, propus de Olejnik şi Algina [ ], urmat de convertirea datelor în termenii lui d a lui Cohen) În cazul metaanalizelor ce includ studii corelaţionale, cea mai întâlnită modalitate de exprimare a mărimii efectului pentru cazul studiilor corelaţionale este r (chiar coeficientul de corelaţie; vezi Hunter şi Schmidt, ) Spre deosebire de algoritmul propus de cei doi autori, un model alternativ care a câştigat tot mai multă popularitate este cel propus de Borenstein et al ( ), care solicită transformarea lui r în z Fischer pentru derularea calculului metaanalitic, urmând ca abia la final rezultatul obţinut să fie reconvertit în coeficientul de corelaţie r Bravais-Pearson Motivul pentru care se apelează la acest subterfugiu este că în cazul utilizării lui z Fisher dispersia asociată fiecărui indicator de mărime a efectului este dependentă exclusiv de volumul eşantionului În schimb, în cazul utilizării directe a lui r, dispersia asociată mărimii efectului este dependentă atât de volumul lotului investigat, cât şi de magnitudinea coeficientului de corelaţie În ştiinţele medicale îndeosebi, dar uneori şi în domeniul psihologiei este întâlnită o altă formă de metaanaliză, bazată pe studierea raportului şanselor (odds ratio) Acest tip de metaanaliză este adaptat comparării programelor de intervenţie în care variabila dependentă este măsurată nominal dihotomic (de exemplu, admis/respins etc ), luându-se în calcul frecvenţele observate De exemplu, două programe educative pot fi comparate în privinţa eficienţei lor (promovarea vs nepromovarea examenului de bacalaureat la prima sesiune) Două programe de consiliere familială şi de cuplu pot fi comparate ca eficienţă din perspectiva reuşitei de a evita divorţul partenerilor aflaţi în situaţii de criză (cupluri divorţate vs nedivorţate) Eficienţa incrementală a unui program de consiliere a carierei asociat unui curs de recalificare profesională poate fi comparată din perspectiva numărului de cursanţi şomeri reangajaţi vs cursanţi în continuare şomeri În toate aceste situaţii, în care comparaţia nu se face la nivel de medii (variabilă dependentă continuă), se poate recurge la compararea frecvenţelor, pe baza raportului şanselor ca indicator al mărimii efectului Pentru calculul mărimii efectului (raportul şanselor) trebuie să se cunoască frecvenţele pentru fiecare dintre cele patru situaţii posibile (de exemplu, cursanţi reangajaţi, respectiv cursanţi cu statutul de şomer din categoria celor care au urmat programul de consiliere în privinţa carierei, respectiv a celor care au urmat doar cursul de recalificare profesională) În lipsa acestor informaţii, raportul şanselor poate fi aproximat şi pe baza indicatorului hi pătrat (pentru un grad de libertate; vezi caseta ), însă rezultatul reprezintă doar o aproximare, nefiind o transformare echivalentă În cazul unui scor hi pătrat căruia îi corespund mai multe grade de libertate, acesta nu trebuie utilizat deoarece, fiind un indicator global (omnibuz), suferă de aceleaşi neajunsuri ca şi indicatorii F asociaţi unui design ANOVA În practică se întâmplă frecvent ca studiile relevante să implice indicatori diferiţi ai mărimii efectului În cadrul casetei sunt prezentate modalităţi de transformare a mărimii efectului dintr-o categorie în alta (de exemplu, transformarea lui r în d Cohen, respectiv a lui ln OR în d Cohen) Trebuie menţionat faptul că aceste transformări vizează atât indicatorii de mărime a efectului în sine, cât şi valorile dispersiei asociate acestor coeficienţi  Figura Schema logică privind tipologia indicatorilor de mărime a efectului şi posibilităţile de convertire a acestora într-un indicator comun (adaptare după Borenstein et al , ) De asemenea, se cuvine să menţionăm că, în derularea unei metaanalize, pot fi convertiţi la un numitor comun indicatori diferiţi ai mărimii efectului (de exemplu, transformarea a trei studii bazate pe ln OR în d Cohen, pentru a avea acelaşi numitor comun în toate cele de studii analizate); de asemenea, este posibil să fie nevoie de convertirea la acelaşi nivel a indicatorilor de mărime a efectului proveniţi din designuri diferite (de exemplu, grupe independente vs grupe dependente/perechi) Indicatorii prezentaţi în cazul A din caseta se referă la cazul cel mai frecvent întâlnit, cel al comparării a două grupe independente Calculul mărimii efectului pentru eşantioane perechi se face pe baza altor formule (vezi Borenstein et al , ) şi conduce la valori mai ridicate ale mărimii efectului Pentru a putea compara metric indicatori ai mărimii efectului obţinuţi din studii cu design diferit, PowerStaTim (Maricuţoiu şi Sava, ) oferă un indicator d ajustat, bazat pe o formulă propusă de Morris şi DeShon ( ), care specifică nivelul estimat al mărimii efectului în cazul în care designul ar fi fost unul de tip intergrup (grupe independente) Această facilitate unică permite includerea studiilor bazate pe un design cu măsurători repetate într-un demers metaanalitic clasic Nu în ultimul rând, se cuvine să facem câteva precizări cu privire la calculul indicatorilor de mărime a efectului într-o metaanaliză pentru alte situaţii decât aceea în care avem un singur indicator per studiu De pildă, pot exista articole publicate care să conţină mai multe studii succesive, fiecare dintre acestea fiind derulat pe eşantioane diferite de participanţi În acest caz, se poate lua fiecare studiu ca unitate independentă de analiză (de exemplu, un articol empiric alcătuit din trei studii succesive va genera trei mărimi diferite ale efectului, câte unul pentru fiecare studiu analizat) O altă situaţie posibilă este aceea în care în cadrul aceluiaşi studiu sunt incluse mai multe variabile dependente care fac referire la acelaşi concept De exemplu, este posibil ca pentru a identifica efectul terapiei cognitiv-comportamentale asupra depresiei pe un lot de participanţi să fie utilizate două măsuri ale depresiei, scalele Beck şi Hamilton Deoarece analiza se face pe acelaşi lot de persoane, nu este indicat să se includă în metaanaliză doi indicatori ai mărimii efectului, unul pentru scala Beck, celălalt pentru scala Hamilton, deoarece este vorba de acelaşi lot de participanţi Soluţia corectă în astfel de cazuri este aceea a utilizării unui singur indicator per studiu, constând în media mărimii efectelor observate pentru cazul scalelor Beck, respectiv Hamilton Acestei medii îi va corespunde o dispersie ajustată, în funcţie de corelaţia dintre cele două măsurători ale aceluiaşi construct, după formula de mai jos:  unde m este numărul de outputuri care se referă la acelaşi construct (de exemplu, m = dacă sunt utilizate două scale pentru a măsura depresia); vi, vj sunt dispersiile asociate mărimii efectelor pentru fiecare dintre cele două scale, iar rij este corelaţia dintre cele două scale Aceeaşi formulă se poate aplica şi atunci când avem măsurători repetate ale unei singure variabile, cum ar fi cazul verificării efectului terapiei cognitiv-comportamentale asupra depresiei în contextul în care studiul măsoară efectul la nivel de follow-up pentru trei perioade distincte: la luni, la luni şi la luni de la finalizarea terapiei În contextul în care nu se precizează valorile coeficienţilor de corelaţie dintre testări sau dintre variabilele output multiple, aceştia se pot estima pe baza literaturii de specialitate (preferabil) sau se pot stabili a priori la o valoare probabilă (de exemplu, r = , ) În sfârşit, o altă situaţie practică posibilă este aceea a existenţei unor studii în care sunt comparate mai mult de două grupe De exemplu, un studiu efectuat de David et al ( ) compară eficienţa terapiei cognitiv-comportamentale clasice (CBT-Beck) cu cea a terapiei raţional-emotive (REBT-Ellis) şi cu cea a farmacoterapiei (fluoxetină) în vederea reducerii simptomatologiei depresive Dacă ceea ce urmărim în metaanaliză este relaţia dintre REBT şi farmacoterapie, lucrurile sunt simple, deoarece se vor lua în considerare doar datele din cele două grupe Dacă metaanaliza vizează studierea efectului terapiei cognitiv-comportamentale în general, indiferent de forma urmată, CBT clasic sau REBT, atunci va trebui utilizată o medie a mărimii efectului obţinută prin comparaţiile CBT clasic – medicaţie, respectiv REBT – medicaţie, ambele fiind relevante pentru a evalua efectul global al terapiei cognitiv-comportamentale în comparaţie cu acelaşi grup de control Pentru calculul dispersiei asociate mediei rezultate se aplică formula menţionată mai sus, luând în considerare o corelaţie de , O altă posibilitate de lucru, în cazul în care datele permit acest lucru, este cea de agregare a datelor provenite din cele două grupe experimentale de interes şi compararea acestui grup nou-format cu cel de control, reprezentat în acest caz de farmacoterapie Selectarea tipului de metaanaliză După calculul manual (vezi caseta ) sau automat, cu ajutorul unor aplicaţii software (Comprehensive MetaAnalysis, Borenstein et al , ; PowerStaTim, Maricuţoiu şi Sava, ; Microsoft Excel – Stat Help, DeCoster, etc ), al mărimii efectului, următorul pas este de a alege modalitatea de combinare a datelor pentru a obţine rezultatele finale ale metaanalizei Acest lucru este dependent de tipul de metaanaliză aleasă: fixă vs random Alegerea se face în funcţie de mai multe considerente, principalul fiind cel al aşteptărilor cercetătorului cu privire la cauzele diferenţelor existente de la un studiu la altul cu privire la valoarea mărimii efectului În cazul metaanalizei efectelor fixe, cercetătorul porneşte de la premisa că există un efect teoretic egal pentru toate studiile şi că diferenţele care apar sunt cauzate de erori în eşantionare (mici variaţii de la un studiu la altul, inerente faptului că se lucrează cu eşantioane limitate ca număr de subiecţi extrase dintr-o populaţie) De exemplu, într-un studiu metaanalitic de tip corelaţional focalizat pe relaţia dintre conştiinciozitate şi performanţă în muncă, metaanaliza efectelor fixe porneşte de la ideea că variaţiile în mărimea efectului de la un studiu la altul sunt cauzate exclusiv de erori în eşantionare, cu atât mai reduse cu cât numărul persoanelor incluse în studiu este mai ridicat, deoarece efectul este acelaşi, indiferent de tipul de populaţie testată (de exemplu, manageri, poliţişti, cadre didactice, artişti etc ) Desigur, o asemenea presupunere este greu de susţinut în practică, deoarece este foarte posibil să nu există un efect similar indiferent de populaţia testată, fapt ce ar presupune că, pe lângă variaţiile determinate de erorile de eşantionare, există diferenţe la nivelul mărimii efectului determinate de specificul populaţiei testate De exemplu, ne aşteptăm la un nivel diferit (mai ridicat) al corelaţiei dintre conştiinciozitate şi performanţa în muncă pentru cazul unor profesii cu nivel ridicat de structurare şi algoritmizare – contabili, operatori de call center etc ), decât în cazul unor profesii cu un nivel scăzut de structurare (de exemplu, actori, muzicieni etc ) Această viziune realistă este îmbrăţişată de modelul metaanalizei efectelor aleatorii, care porneşte de la premisa că variaţiile mărimii efectului observate de la un studiu la altul au mai multe cauze, nu numai una Astfel, pe lângă erorile de eşantionare (dispersie intrastudiu) prezumate şi în cazul metaanalizei efectelor fixe, apar variaţii determinate de diferenţele calitative dintre populaţiile din care au fost extrase eşantioanele de participanţi la studii Cu alte cuvinte, nu se porneşte de la premisa că ar exista un efect fix teoretic, ci că aceste efecte sunt distribuite normal în jurul unei medii, fiind dependente şi de variaţiile sistematice de la nivelul studiilor (dispersie interstudii) Din cele prezentate rezultă că metaanaliza efectelor random porneşte de la o premisă mai realistă decât metaanaliza efectelor fixe, deoarece este puţin probabil să găsim un efect fix indiferent de populaţia investigată Cu toate acestea, destul de mulţi autori apelează la metaanaliza efectelor fixe, deoarece: (a) este mai puţin pretenţioasă din perspectiva numărului de studii putând fi efectuată chiar şi în situaţia reunirii unui număr redus de studii (de exemplu, - ), în timp ce metaanaliza efectelor aleatorii necesită un număr ridicat de studii (în general peste ) pentru a oferi indicatori statistici nedistorsionaţi ; (b) este mai puţin conservatoare, puterea statistică fiind mai ridicată într-o metaanaliză a efectelor fixe decât într-o metaanaliză a efectelor random, prin urmare fiind şanse mai mari de a găsi efecte semnificative statistic într-o metaanaliză a efectelor fixe; (c) este mai uşor de realizat dacă se apelează la calculul manual, deoarece implică formule mai puţin complicate (vezi comparativ casetele şi privind coeficienţii de ponderare w asociaţi metaanalizei efectelor fixe, respectiv efectelor random după Borenstein et al , ) Totuşi, cu excepţia cazului în care există un număr redus de studii, recomandarea noastră ar fi aceea de a utiliza metaanaliza efectelor aleatorii datorită premiselor realiste de la care porneşte acest gen de analiză şi datorită filtrelor suplimentare utilizate (de exemplu, nu se ţine cont în calcularea efectului final mediu doar de variaţii în volumul eşantioanelor, ci şi de gradul de omogenitate a indicatorilor obţinuţi, penalizând astfel efectele extreme, adică situaţiile în care rezultatele obţinute sunt mai puţin consistente) În sfârşit, o altă raţiune semnificativă pentru a utiliza metaanaliza efectelor aleatorii ori de câte ori este posibil are în vedere concluziile ce pot fi desprinse din metaanaliză În metaanaliza efectelor fixe rezultatul obţinut nu poate fi extrapolat, el fiind valabil doar pentru tipul de indivizi investigaţi În metaanaliza efectelor aleatorii rezultatul final obţinut are un nivel ridicat de generalizare, inclusiv la alte populaţii decât cele incluse în studiu În sfârşit, o situaţie particulară este realizarea unei metaanalize a efectelor mixte, posibilă deoarece într-un demers metaanalitic pot fi urmărite mai multe niveluri ierarhice (de exemplu, efectul global pentru relaţia dintre conştiinciozitate şi performanţa în muncă – un nivel ierarhic superior –, cât şi o serie de efecte valabile la nivel de subgrupe de studiu, cum ar fi relaţia dintre conştiinciozitate şi performanţa în muncă în trei situaţii distincte: pentru funcţii manageriale [de decizie]; pentru funcţii executive slab structurate [antreprenori, artişti] şi pentru funcţii executive puternic structurate [contabili, operatori pe maşini automatizate etc ]) Dacă se aplică modele de lucru diferite – de exemplu, metaanaliza efectelor aleatorii în cadrul fiecăruia dintre cele trei domenii exemplificate, respectiv metaanaliza efectelor fixe pentru rezultatul global –, vorbim despre cazul special al metaanalizei efectelor mixte Implicaţii practice ale alegerii O implicaţie imediată constă în algoritmul de calculare a mediei ponderate a mărimii efectelor din studiile analizate Astfel, în niciunul dintre tipurile de metaanaliză menţionate media calculată nu se rezumă la o simplă medie aritmetică, ci se ţine seama de o medie aritmetică ponderată În cazul metaanalizei efectelor fixe, ponderarea variază pe o amplitudine mai mare, acordându-se o pondere mai mare studiilor cu mulţi subiecţi şi o pondere mai mică studiilor cu un număr redus de participanţi În cazul metaanalizei efectelor aleatorii, ponderarea variază în mai mică măsură în funcţie de volumul eşantionului (deşi se menţine o asemenea diferenţiere), coeficientul de ponderare fiind dependent şi de discrepanţa mărimii efectului observată într-un studiu faţă de media studiilor analizate Borenstein et al ( ) prezintă consecinţele acestor diferenţieri: (a) volumul eşantionului afectează în mai mare măsură ponderile acordate în metaanaliza efectelor fixe decât în cea a efectelor aleatorii; (b) valoarea dispersiei, cea a erorii standard de măsurare şi cea a intervalului de încredere pentru media efectelor ponderate vor fi întotdeauna mai mari în cazul metaanalizei efectelor aleatorii decât a efectelor fixe, pentru că la dispersia cauzată de eroarea de eşantionare (dispersia intrastudiu) se adaugă dispersia datorată diferenţelor calitative dintre populaţiile investigate (dispersia interstudii; vezi caseta ) Caseta Calculul ponderii acordate unui studiu în cazul unei metaanalize a efectelor random după Borenstein et al ( ) – cazul comparaţiilor dintre medii d, k mărimea efectului (d Cohen) – vezi formula în caseta ; numărul de studii incluse în analiză (k)  w, wrandom w – ponderea asociată mărimii efectului (metaanaliza fixă); wrandom – ponderea asociată mărimii efectului în metaanaliza efectelor random  T², vd, I² T² este dispersia interstudii; vd este dispersia intrastudii (sau dispersia mărimii efectului pentru metaanaliza efectelor fixe; vezi formula în caseta ); I² este un indicator al eterogenităţii efectelor  unde  iar      Q, C indicatori ai eterogenităţii indicatorilor de mărime a efectelor            Observaţie! Formulele se aplică şi în celelalte tipuri de metaanaliză, cu înlocuirea lui d şi vd cu indicatorii corespunzători (de exemplu, z şi vz pentru metaanaliza corelaţiilor) Dacă T² este negativ, i se atribuie valoarea Formulele de calcul pentru vd etc sunt prezentate în caseta Calcularea principalilor indicatori metaanalitici Discuţiile tehnice prezentate la primii doi paşi ai metaanalizei pot fi tratate expeditiv de consumatorii de literatură metaanalitică neinteresaţi de modul efectiv de calcul În schimb, această secţiune este importantă pentru a înţelege modul de interpretare a rezultatelor unei metaanalize Iată o analogie între metaanaliză şi informaţiile din statistica descriptivă  Figura Indicatorii descriptivi pentru un set de date (stânga) şi pentru metaanaliză (dreapta) Astfel, orice curs introductiv de statistică porneşte de la premisa că, pentru a descrie datele numerice obţinute la un eşantion de subiecţi, avem nevoie în primul rând de o medie şi o abatere standard care să descrie setul de date analizat Suplimentar, se poate analiza forma distribuţiei pentru a observa, de exemplu, dacă datele colectate sunt foarte omogene (grupate în jurul mediei – distribuţie leptocurtică) sau sunt mai degrabă eterogene (foarte împrăştiate – distribuţie platicurtică) De asemenea, se poate calcula un interval de încredere pentru media obţinută, care ar indica valorile între care se situează media dacă din cadrul populaţiei vizate ar fi fost selectat alt set de participanţi (ţinând cont de erorile de eşantionare inerente) Aceeaşi logică este utilizată într-un demers metaanalitic pentru a găsi indicatorii descriptivi potriviţi pentru a descrie setul de studii analizate (prezentaţi schematic în figura de mai sus) Pe baza acestor indicatori putem răspunde la următoarele întrebări (în paranteză fiind specificaţi indicii necesari): – Efectul investigat este unul robust, semnificativ diferit de zero (media aritmetică ponderată, eroarea standard a mediei şi intervalul de încredere asociat mediei)? – Efectul investigat este unul omogen – relativ similar – sau unul eterogen – variază mult de la un studiu la altul, fiind dependent de anumite caracteristici ale studiului (indicatorii Q şi I² ce estimează omogenitatea/eterogenitatea efectului)? În cazul identificării unui efect eterogen se poate răspunde la alte două întrebări posibile: „Ce caracteristici ale studiilor contribuie la variaţii în mărimea efectului?”, respectiv „În termeni procentuali, cât la sută explică aceste caracteristici din modul de variere a mărimii efectului?” Aceste întrebări suplimentare menite să explice motivele apariţiei eterogenităţii efectelor sunt discutate detaliat în secţiunea Interpretarea indicatorilor specifici metaanalizei Valorile mediei aritmetice ponderate constituie unul dintre cei mai importanţi indicatori rezultaţi în urma demersului metaanalitic Interpretarea acestui indicator statistic se poate face atât din perspectiva atât a statisticii descriptive, cât şi a celei inferenţiale Tabelul Semnificaţia valorilor mărimii efectului din perspectiva statisticii descriptive Tip de metaanaliză Efect Semnificaţie a valorilor (semne) Valori scăzute Valori medii Valori ridicate  Comparaţii între medii d, g Rezultatele cu semnul plus indică diferenţe în direcţia aşteptată (de exemplu, ME – mc > ), în timp ce rezultatele cu semnul minus indică diferenţe în direcţia contrară (de exemplu, mE – mc ), iar rezultatele subunitare (între şi ) indică diferenţe de frecvenţe mai mici în grupul experimental Rezultatele exprimate în log OR cu semnul plus indică diferenţe în direcţia aşteptată (de exemplu, OR = , sau , log OR = , în modul OR = , sau , log OR = , în modul OR = , sau , log OR = , în modul    f succes E – f succes C > ) Rezultatele exprimate în log OR cu semnul minus indică diferenţe în direcţia contrară (de exemplu, f succes E – f succes C , ), fapt pentru care se poate spune că tipul de participanţi incluşi în studiu nu afectează magnitudinea corelaţiei dintre conştiinciozitate şi absenteism Impactul procentual al variabilelor moderatoare Indiferent dacă se apelează la metaregresii sau la analiza diferenţelor dintre subgrupuri, atunci când se utilizează un model al efectelor random (nu este şi cazul exemplului lucrat) se poate oferi un răspuns suplimentar Mai concret, se poate aprecia procentual impactul unei variabile moderatoare analizate luând în calcul totalul variaţiilor observate în magnitudinea efectelor ce pot fi puse pe seama diferitelor caracteristici ale studiilor (procent din I²) Acest indicator poate fi interpretat similar cu indicatorul R² întâlnit în cazul regresiilor liniare, luând valori între şi %, cu precizarea că el explică procentual doar evoluţia dispersiei determinate de diferite caracteristici ale studiilor (dispersia intergrup), nu şi dispersia determinată de erorile de eşantionare (dispersia intragrup) Aşa cum am amintit, un astfel de indicator are sens doar în cazul unei metaanalize a efectelor random, deoarece în cazul metaanalizei efectelor fixe se porneşte de la asumpţia că diferenţele observate între valorile mărimilor efectului sunt cauzate exclusiv de erori de eşantionare Verificarea robusteţii rezultatelor obţinute După discutarea principalelor rezultate obţinute (nivelul şi semnificaţia mediei ponderate, nivelul de eterogenitate a datelor) şi a surselor (caracteristici ale studiilor) care prezic variaţii în magnitudinea efectului, sunt necesare câteva analize suplimentare care pot fi împărţite în două mari categorii: (a) analiza sensibilităţii rezultatelor; (b) analize ale gradului de distorsiune a rezultatelor pentru a vedea în ce măsură rezultatele sunt afectate de studiile relevante neidentificate (nepublicate) Analiza sensibilităţii rezultatelor Acest tip de analiză urmăreşte compararea rezultatelor obţinute în metaanaliză cu cele obţinute în situaţia ipotetică în care am fi apelat la alte restricţii de selectare a studiilor De exemplu, o metaanaliză privind efectul terapiei cognitiv-comportamentale asupra reducerii simptomatologiei depresive la adolescenţi ar putea fi realizată incluzând atât studiile de tip experimental (cu grup de control), cât şi pe cele de tip cvasiexperimental (cu grup de control) O analiză a sensibilităţii ar urmări robusteţea rezultatelor în contextul în care analiza cuprinde ambele categorii de studii sau doar pe cele experimentale În exemplul nostru cu privire la relaţia dintre conştiinciozitate şi absenteism, să presupunem că trăsătura de personalitate a fost evaluată în cinci dintre cazuri cu proba NEO-FFI (Costa şi McRae, ), iar în alte două cazuri cu un alt instrument valid pentru evaluarea conştiinciozităţii O analiză de sensibilitate ar putea viza în ce măsură rezultatele metaanalizei converg în aceeaşi direcţie în cazul analizării tuturor celor şapte studii faţă de aceea în care am cuprinde doar cele cinci studii în care s-a utilizat NEO-FFI ca instrument de evaluare a personalităţii Pe scurt, prin analiza de sensibilitate se urmăreşte în primul rând să se evidenţieze impactul pe care diferite decizii de selectare (criterii de includere) a studiilor sau anumite decizii de calcul (efecte fixe sau random) îl au asupra rezultatului metaanalizei Desigur, ideal ar fi ca efectele obţinute să fie similare (robuste) indiferent de variaţiile luate în calcul printre criteriile de includere a studiilor sau printre metodele de calcul utilizate Analizele de moderare menţionate în secţiunea pot fi utilizate pentru a verifica robusteţea efectelor, fiind de dorit să nu existe un efect moderator semnificativ statistic Analize ale gradului de distorsiune a rezultatelor în urma selecţiei studiilor Oricât de mult s-ar strădui un cercetător să găsească toate studiile relevante pe o anumită tematică, există o probabilitate foarte mare ca unele studii să nu fie incluse, şi pentru simplul fapt că o parte dintre studiile realizate nu ajung să fie publicate sau măcar comunicate În acest context, se pune problema măsurii în care rezultatele rămase în „sertar” afectează rezultatele metaanalizei În acest scop au fost identificate o serie de proceduri menite să indice: (a) nivelul riscului de a întâlni un caz de distorsiune a rezultatelor ca urmare a eşecului de a include toate studiile eligibile; (b) nivelul robusteţii rezultatelor obţinute, în ciuda existenţei unei distorsiuni în rezultatele metaanalizei; (c) impactul distorsiunii asupra rezultatelor Pentru primul nivel al discuţiei, cel al identificării riscului de a avea rezultate distorsionate, modalitatea tipică utilizată este norul de puncte de tipul pâlniei întoarse (simetrice; funnel plot) În mod normal, dacă există un risc ridicat de distorsiune, atunci norul de puncte nu este unul simetric, ci există tendinţa de a observa mai multe studii cu o mărime a efectului scăzută în cazul studiilor efectuate pe eşantioane mari de persoane (ce induc valori scăzute ale erorii standard de măsurare) decât în cazul studiilor efectuate pe eşantioane reduse ca volum de persoane Acest lucru se întâmplă din cauza tendinţei multor publicaţii ştiinţifice de a accepta cu precădere articole în care se obţin rezultate semnificative statistic, asociate cu o probabilitate scăzută de a obţine un rezultat semnificativ statistic în contextul unui efect scăzut şi al unui eşantion redus de participanţi De aceea, premisa de la care se porneşte este aceea că studiile rămase nepublicate pot distorsiona rezultatul metaanalizei În cazul în care nu sunt semne de distorsiune, graficul ar trebui să fie unul simetric, cu efecte mai ridicate sau mai scăzute obţinute indiferent de volumul eşantioanelor incluse în studiu, chiar dacă în cazul studiilor efectuate pe un număr mare de respondenţi variaţia efectelor tinde să scadă, deoarece valorile respective se apropie în mai mare măsură de media teoretică a efectului de la nivelul populaţiei Un asemenea grafic se realizează în mod convenţional prin exprimarea valorii mărimilor efectelor pe axa orizontală şi a volumului eşantionului (sau a erorii standard de măsurare) pe axa verticală  Figura Situaţie indicativă pentru absenţa distorsiunii de publicare (simetric; în stânga), respectiv pentru prezenţa distorsiunii de publicare (asimetric; în dreapta) Totuşi, deşi metoda este intuitivă, ea are câteva neajunsuri ce merită semnalate: (a) pentru a fi aplicată este nevoie de un număr destul de ridicat de studii identificate (de exemplu, cel puţin ), deoarece este dificil de apreciat gradul de simetrie/asimetrie atunci când numărul de studii este unul foarte redus; (b) asimetria/simetria este analizată subiectiv, la nivelul impresiei (percepţiei) cercetătorului, nefiind susţinută de indicatori concreţi; (c) în sfârşit, chiar dacă se constată asimetria datelor, nu se poate determina calitatea studiilor neincluse în analiză, fiind posibil ca acele efecte mici să fie cauzate de anumite probleme metodologice (variabile străine necontrolate), fapt care ar îndreptăţi excluderea studiilor respective din analiză Într-un asemenea context nu ar fi corect să vorbim despre distorsiunea rezultatelor din metaanaliză, ci despre o decizie corectă de excludere a acestora În privinţa celei de-a doua limitări sesizate, cea legată de impresia subiectivă, unele programe specializate, precum Comprehensive MetaAnalysis, oferă indicatori suplimentari, cum ar fi coeficientul de corelaţie a rangurilor al lui Begg şi Mazumdar ( ) sau interceptul lui Egger et al ( ) Găsirea unui rezultat semnificativ în urma calculării acestor indicatori obiectivi ar indica prezenţa unei distorsiunii de publicare, însă trebuie menţionat faptul că pragurile de semnificaţie asociate acestor indicatori sunt adecvate în contextul unui număr suficient de mare de studii luate în calcul În caz contrar, pentru analize efectuate pe un număr redus de studii există riscul obţinerii unor rezultate nesemnificative statistic, din cauza unei puteri statistice reduse, ceea ce nu ar însemna neapărat absenţa distorsiunii determinate de neincluderea unor studii Prin urmare, pentru a aprecia corect riscul prezenţei unei distorsiuni în rezultatele metaanalizei, toate metodele menţionate mai sus funcţionează eficient doar în contextul existenţei unui număr destul de mare de studii incluse (cel puţin ) Pentru alte situaţii, cum este cazul relaţiei dintre conştiinciozitate şi absenteism în care au fost incluse doar şapte studii, aceşti indicatori sunt mai puţin relevanţi, din cauza puterii statistice reduse de a decela distorsiunile existente Totuşi, în contextul obţinerii de indicatori semnificativi statistic şi a unui grafic de tip pâlnie evident asimetric, putem miza pe existenţa unei distorsiuni a rezultatelor inclusiv în cazul unui număr redus de studii incluse O întrebare adiacentă legată de problema distorsionării rezultatelor, mai ales în contextul în care se sesizează o asemenea tendinţă, este aceea a identificării numărului de studii de siguranţă (fail-safe N) În varianta sa mai cunoscută (clasică) propusă de Rosenthal (apud Borenstein et al , ; vezi Radu et al , pentru formula de calcul), se poate identifica numărul de studii care lipsesc având un efect egal cu zero (de exemplu, r = , ) necesar pentru a schimba media mărimii efectului dintr-un rezultat semnificativ statistic într-unul nesemnificativ statistic Utilizând Comprehensive MetaAnalysis (Borenstein et al , ) pentru a obţine acest indicator în exemplul dat, vom observa că ar fi nevoie de un număr de de studii cu efect nul pentru a ajunge la concluzia că nu există o legătură între conştiinciozitate şi absenteism, respectiv de un număr de de studii cu efect nul pentru a ajunge la concluzia că între nivelul de neuroticism şi absenteism nu există o legătură semnificativă O alternativă de calcul realistă şi mai adaptată cerinţelor practicienilor este cea propusă de Orwin Acesta permite estimarea numărului de studii neincluse în metaanaliză care ar schimba valoarea mediei ponderate a mărimii efectului până la un anumit nivel minim acceptat (de exemplu, în cazul corelaţiilor un asemenea nivel ar putea fi r = , , specific unui efect scăzut, cu utilitate practică redusă) Cu alte cuvinte, metoda propusă de Orwin identifică numărul de studii necesare pentru a transforma un efect observat în unul fără relevanţă practică deosebită, chiar dacă efectul luat ca reper nu este nul De asemenea, acest indicator îi oferă cercetătorului flexibilitatea de a specifica pentru studiile neincluse, pe lângă valoarea zero (absenţa totală a efectului), şi alte valori medii diferite de zero (de exemplu, un r mediu de , pentru studiile neincluse) Astfel, în contextul dat, ne-am putea întreba care este numărul necesar de studii neincluse pentru ca media ponderată a mărimii efectului să ajungă la un nivel minim acceptat de , (pentru relaţia dintre neuroticism şi absenteism), respectiv de – , (pentru relaţia dintre conştiinciozitate şi absenteism), în contextul în care media efectelor din studiile neincluse ar fi nulă (r = , ) Utilizând un program specializat, precum Comprehensive MetaAnalysis (Borenstein et al , ), am obţine următoarele valori: doar studii neincluse cu efecte nule ar fi necesare pentru a reduce mărimea efectului la o valoare minim acceptabilă de – , pentru relaţia dintre conştiinciozitate şi absenteism, respectiv doar studii neincluse ar fi necesare pentru a reduce mărimea efectului privind relaţia dintre neuroticism şi absenteism la un nivel minim ca valoare practică (r = , ) Desigur, aceste valori sunt valabile în contextul în care am specificat că studiile neincluse ar avea o mărime a efectului egală cu zero Interpretarea acestor rezultate se face contextual De pildă, - studii neincluse semnifică un risc mare de distorsiune în date dacă cercetătorul reuşeşte să identifice de studii eligibile, fiind posibil ca un procent de - % din studii să scape analizei Aceeaşi valoare de - studii neincluse înseamnă însă un risc mai scăzut de distorsiune în cazul în care au fost identificate mai puţin de studii eligibile, deşi au fost respectaţi paşii de evaluare sistematică a literaturii de specialitate Putem afirma acest lucru pentru că este puţin probabil să scape analizei un procent de - % din totalul studiilor relevante, dacă evaluarea sistematică a fost realizată corect În sfârşit, o altă metodă de lucru în cazul identificării unui risc crescut de distorsiune a datelor este metoda tăierii şi adăugirii (trim and fill) propusă de Duval şi Tweedie ( ) Această procedură iterativă porneşte de la graficul de tip pâlnie întoarsă, încercând să adauge sau să elimine studii astfel încât să se obţină un grafic simetric Desigur, o asemenea analiză este implementată doar dacă se constată o distribuţie asimetrică a efectelor Din acest punct de vedere, demersul se apropie de ideea analizei sensibilităţii, răspunzându-se la întrebarea: „Care ar fi media ponderată a mărimii efectului dacă nu ar exista distorsiunea de includere selectivă a studiilor?” Cu ajutorul programelor specializate, precum Comprehensive MetaAnalysis (Borenstein et al , ), se pot compara direct indicatorii importanţi (medie, abatere standard, interval de încredere, eterogenitate), atât pentru cazul analizei rulate pe studiile identificate iniţial, cât şi pentru cazul analizei realizate pe un set modificat de studii (obţinut prin adăugarea/eliminarea unor efecte), astfel încât să se reflecte o distribuţie simetrică, ceea ce semnifică absenţa distorsiunii induse de studiile neincluse în analiză Concluzii Apelul la evaluarea sistematică a unei tematici prin intermediul tehnicii metaanalitice constituie principala modalitate de sistematizare a rezultatelor dintr-un domeniu de interes Metaanaliza nu are însă doar rolul unui demers sumativ, ci poate deschide noi direcţii de acţiune (ridică noi întrebări de investigat) Calitatea rezultatelor unei metaanalize este dependentă de măsura în care cercetătorul a inclus toate studiile relevante pentru tema de investigat, cât şi de criteriile de selecţie utilizate (de exemplu, metaanalizele care vizează identificarea unei relaţii de tip cauză-efect includ doar studii experimentale) Orice evaluare sistematică ar trebui să facă apel la cel puţin două baze de date independente şi să aplice strategii alternative de identificare a unor studii relevante În privinţa metaanalizei, deşi există o multitudine de indicatori statistici disponibili, cel mai adesea un demers metaanalitic complet va face referire la: (a) prezentarea mediei efectului, a abaterii standard şi/sau a intervalului de încredere pentru aceasta, precum şi a gradului de semnificaţie a acestui rezultat (semnificativ sau nesemnificativ statistic); (b) analiza nivelului de omogenitate/eterogenitate a efectului găsit (Q) şi a măsurii în care aceste variaţii pot fi explicate de caracteristici ale studiilor (I²); (c) în cazul sesizării unor efecte eterogene ce pot fi explicate de caracteristici diferite ale studiilor incluse, metaanaliza se completează cu metaregresii şi analize de subgrupuri pentru a identifica rolul/impactul fiecărei caracteristici relevante în dinamica mărimii efectului analizat; (d) suplimentar, ar fi necesar să se facă referiri la analiza sensibilităţii şi a distorsionării rezultatelor, pentru a aprecia nivelul de robusteţe al rezultatelor exprimate În ceea ce priveşte metodele de lucru, cel mai potrivit model este cel al efectelor random, deoarece este puţin probabil ca efectele observate de-a lungul studiilor să varieze doar din cauza unor erori de eşantionare În plus, acest model are avantajul de a extinde concluziile, dincolo de sfera studiilor analizate şi se pretează mai bine atunci când sunt cuprinse mai multe studii (de exemplu, cel puţin - ), lucru mai dificil de realizat în unele cazuri, mai ales dacă se doreşte realizarea unei serii de analize la nivel de subgrupuri Lecturi suplimentare Michael Borenstein, Larry V Hedges, Julian P T Higgins, Hannah R Rothstein ( ) Introduction to MetaAnalysis Chichester, UK: Wiley Această carte este fundamentală pentru cei care doresc să înţeleagă în profunzime aspectele prezentate pe parcursul acestui capitol, ea devenind foarte curând principala lucrare de referinţă în domeniul metaanalizei Autorii cărţii sunt cei care au introdus şi programul adiacent menţionat în acest capitol, Comprehensive MetaAnalysis, acesta fiind disponibil gratuit, într-o variantă demonstrativă cu termen de valabilitate limitată Julian P T Higgins, Sally E Green ( ) Cochrane Handbook for Systematic Reviews of Interventions Version (updated March ) Disponibil la http://www cochrane-handbook org Referinţa este utilă îndeosebi celor din zona psihologiei clinice şi a psihoterapiei, fiind o lucrare necesară pentru a înţelege pas cu pas ce înseamnă şi cum se realizează efectiv o evaluare sistematică Mark W Lipsey, David B Wilson ( ) Practical MetaAnalysis Thousand Oaks, SUA: Sage Publications Recomand lucrarea îndeosebi celor care au o formare umanistă şi care au întâmpinat dificultăţi în a înţelege concepte din zona metodologiei cercetării şi a statisticii sociale Cartea este scrisă într-un limbaj accesibil, oferind o imagine de ansamblu atât asupra evaluării sistematice, cât şi asupra demersului metaanalitic propriu-zis Laurenţiu P Maricuţoiu ( ) Introducere în metaanaliză Metaanaliza corelaţiilor Psihologia Resurselor Umane, , pp - Articolul detaliază fundamentele metaanalizei şi prezintă punctual paşii necesari pentru derularea unei metaanalize bazate pe studii corelaţionale, după modelul propus de Hunter şi Schmidt ( / ), un model de lucru răspândit mai ales în domeniul psihologiei organizaţionale, o zonă de cercetare în care predomină studiile de tip non-experimental Bibliografie APA ( ) PsycINFO – American Psychological Association Găsit la adresa: http://www apa org/ pubs/databases/psycinfo/index aspx Becker, L A ( ) Effect size calculators Găsit la adresa http://www uccs edu/~faculty/lbecker/ Begg, C B , Mazumdar, M ( ) Operating characteristics of a rank correlation test for publication bias Biometrics, , pp - Borenstein, M Hedges, L V , Higgins, J P T , Rothstein, H R ( ) Introduction to MetaAnalysis Chichester: Wiley Borenstein, M , Hedges, L V , Higgins, J P T , Rothstein, H R ( ) Metaanalysis: Computing treatment effects and effect sizes Chichester: Wiley Borenstein, M , Hedges, L V , Higgins, J P T , Rothstein, H R ( ) Comprehensive MetaAnalysis Version , Biostat Găsit la www MetaAnalysis com Clark-Carter, D ( ), Quantitative psychological research: the complete student’s companion (ediţia a III-a) New York: Psychology Press Campbell Collaboration ( ) What is systematic review? Disponibil la adresa http://www campbellcollaboration org/ Cochrane Collaboration ( ) RevMan Găsit la adresa www cc-ims net/revman Cohn, L D , Becker, L A ( ) How metaanalysis increases statistical power Psychological Methods, , pp - Cooper, H ( ) Research synthesis and metaanalysis A step by step approach (ediţia a IV-a) Thousand Oaks: Sage Costa, P T , McRae, R R ( ) Revised NEO personality inventory and NEO-five-factor inventory: Professional manual Odessa FL, USA: Psychological Assessment Resources David, D , Szentagotai, A , Lupu, V , Cosman, D ( ) Rational emotive behavior therapy, cognitive therapy, and medication in the treatment of major depressive disorder: A randomized clinical trial, post-treatment outcomes, and six-month follow-up Journal of Clinical Psychology, , pp - DeCoster, J ( ) Metaanalysis notes Găsit la adresa http://www stat-help com/notes html DeCoster, J ( ) Microsoft Excel Spreadsheets Disponibil la adresa http://www stat-help com/spreadsheets html Duval, S , Tweedie, R ( ) A nonparametric „trim and fill” method of accounting for publication bias in metaanalysis Journal of the American Statistical Association, , pp - Egger, M , Davey Smith, G , Schneider, M; Minder, C ( ) Bias in metaanalysis detected by a simple, graphical test British Medical Journal, , pp - Field, A ( ) Metaanalysis of correlation coefficients: a Monte Carlo comparison of fixed- and random-effects methods Psychological Methods, , pp - Field, A ( ) Can metaanalysis be trusted? The Psychologist, , pp - Field, A ( ) Metaanalysis În J Miles şi P Gilbert (eds ), A Handbook of Research Methods in Clinical & Health Psychology (pp - ) Oxford: Oxford University Press Green, S G , McDonald, S ( ) The Cochrane Collaboration: More than systematic reviews? Internal Medicine Journal, , pp - Hedges, L V , Olkin, I ( ) Statistical methods for metaanalysis Orlando: Academic Press Higgins J P T , Green S (eds ) ( ) Cochrane Handbook for Systematic Reviews of Interventions Version [updated March ] The Cochrane Collaboration, Disponibil la: www cochrane-handbook org Higgins, J P T , Thompson, S G Deeks, J J , Altman, D G ( ) Measuring inconsistency in metaanalyses British Medical Journal, , pp - Hunter, J E , Schmidt, F L ( ) Methods of MetaAnalysis: Correcting Error and Bias in Research Findings (ediţia a II-a) Thousand Oaks: Sage Linden, W , Phillips, M J , Leclerc, J ( ) Psychological treatment of cardiac patients: A metaanalysis European Heart Journal, , pp - Lipsey, M W , Wilson, D B ( ) Practical Metaanalysis Thousand Oaks: Sage Lyons, L C , Morris, W A ( ) The MetaAnalysis Calculator Disponibil la adresa http://www lyonsmorris com/ma /index cfm Maricuţoiu, L P ( ) Introducere în metaanaliză Metaanaliza corelaţiilor Psihologia Resurselor Umane, , pp - Maricuţoiu, L P , Sava, F A ( ) PowerStaTim – Analiza puterii statistice şi a mărimii efectului Disponibil la: www psihologietm ro McDaniel, M A ( ) Big-brained people are smarter: A metaanalysis of the relationship between in vivo brain volume and intelligence Intelligence, , pp - Moher, D , Jadad, A R , Nichol, G , Penman, M , Tugwell, P , Walsh, S ( ) Assessing the quality of randomized controlled trials: An annotated bibliography of scales and checklists Controlled Clinical Trials, , pp - Moher, D , Jadad, A R , Tugwell, P ( ) Assessing the quality of randomized controlled trials: Current issues and future directions International Journal of Technology Assessment in Health Care, , pp - Morris, S B , DeShon, R P ( ) Combining effect size estimates in metaanalysis with repeated measures and independent-groups designs Psychological Methods, , pp - Mulrow, C D ( ) Systematic reviews: Rationale for systematic reviews British Medical Journal, , pp - Olejnik, S , Algina, J ( ) Generalized eta and omega squared statistics: Measures of effect size for some common research designs Psychological Methods, , pp - Radu, I , Miclea, M , Albu, M , Moldovan, O , Nemeş, S , Szamoskozy, S ( ) Metodologie psihologica si analiza datelor Bucureşti : Sincron Spring, B ( ) Evidence-based practice in clinical psychology: What it is, why it matters; what you need to know Journal of Clinical Psychology, , pp - US Department of Education, Office of Planning, Evaluation, and Policy Development ( ) Evaluation of evidence-based practices in online learning: A metaanalysis and review of online learning studies Washington DC, disponibil la adresa www ed gov/about/offices/list/opepd/ppss/ reports html Wells, G A , Shea, B , O’Connell, D , Peterson, J , Welch, V , Losos, M , Tugwell, P ( ) The Newcastle-Ottawa Scale (NOS) for assessing the quality of nonrandomised studies in metaanalyses disponibil la adresa: http://www ohri ca/programs/clinical epidemiology/oxford htm Wikipedia ( ) List of academic databases and search engines disponibil la adresa: http://en wikipedia org/wiki/List of academic databases and search engines Dintre sintezele de tip narativ, cel mai întâlnit tip este sinteza teoretică (Cooper, ) Aceasta are rolul de a evalua comparativ teoriile utilizate pentru a vedea care dintre ele explică mai bine anumite fenomene, punând accent pe descrierea unor experimente critice pentru a diferenţia între teorii, pe dovezile empirice care contrazic sau sprijină anumite modele teoretice şi pe anumite reformulări/modificări conceptuale necesare pentru a nu respinge o anumită teorie (revizuiri ale teoriilor) Conform Campbell Collaboration ( ), o sinteză a literaturii de specialitate poate fi denumită evaluare sistematică dacă îndeplineşte următoarele criterii: (a) se bazează pe criterii clare de includere/excludere a studiilor; (b) specifică explicit strategia utilizată pentru căutarea studiilor; (c) foloseşte un sistem de codare a variabilelor de interes din studiile selectate în baza unui manual de codare; (d) se finalizează printr-o metaanaliză (dacă este posibil) Pentru o listă extinsă a bazelor de date internaţionale existente, recomand consultarea Wikipedia ( ) Maricuţoiu ( ) introduce pentru publicul de la noi această formă de metaanaliză, discutând cazul particular al metaanalizei corelaţiilor Printre cei care au colaborat la realizarea acestui program se regăsesc: David Wilson, Betsy Becker, Julian Higgins, Will Shadish, Hannah Rothstein, Michael Borenstein, Larry Hedges, Harris Cooper şi Mark Lipsey O excepţie în care putem lua în analiză mai mulţi indicatori output proveniţi din acelaşi studiu este cazul în care suntem interesaţi să urmărim în cadrul metaanalizei dacă instrumentele de lucru constituie o variabilă moderatoare (de exemplu, dacă efectul terapiei asupra simptomatologiei depresive este moderat de tipul de instrument utilizat – Beck sau Hamilton) Pentru a răspunde punctual la acest aspect, vom lucra nu cu un eşantion de studii, ci cu un eşantion de mărimi ale efectelor, fapt ce ne va permite să testăm dacă există diferenţe semnificative de mărime a efectului între studiile care au utilizat proba Hamilton, respectiv proba Beck O altă excepţie este cazul în care urmărim efecte pe paliere diferite De exemplu, într-un studiu care vizează efectul jocurilor video cu conţinut violent asupra agresivităţii la copii pot fi analizate separat efectele produse la nivelul cogniţiilor agresive şi cele care vizează comportamentul agresiv Field ( ), în baza unei simulări de tip Monte Carlo, concluzionează că în cazul metaanalizei efectelor random aplicate în cazul corelaţiilor, atât pentru metoda descrisă (Borenstein et al , , bazată pe Hedges şi Olkin, ), cât şi pentru metoda propusă de Hunter şi Schmidt ( ), apare un risc crescut de eroare de tip I dacă sunt utilizate cel mult studii Studiile metaanalitice, comparativ cu cele empirice (primare), au o putere statistică mult mai mare (îndeosebi metaanaliza efectelor fixe), crescând şansele de a găsi efecte semnificative statistic Sugestiv ar fi exemplul amintit de Cohn şi Becker ( ), al unei metaanalize ce vizează impactul unui tratament medicamentos aplicat pacienţilor care au suferit un infarct miocardic Deşi în dintre cele de studii incluse în metaanaliză au fost observate efecte nesemnificative statistic, efectul mediu rezultat din metaanaliză a fost unul semnificativ statistic, scăzând cu % riscul mortalităţii în rândul pacienţilor care au beneficiat de tratamentul respectiv După unii autori, precum Field ( ), a cunoaşte aceşti factori moderatori este mai important decât rezultatele generale (media ponderată a mărimii efectului) în sine În această direcţie, Field ( ) apelează la o parabolă elocventă, aceea a realizării unei metaanalize pe baza a trei studii, efectuate pe un număr egal de participanţi, în care s-au obţinut următoarele efecte ale unui medicament miraculos care să-i ajute pe studenţi să înţeleagă cunoştinţele de statistică: d = , (în studiul din SUA), d = , (în studiul din Belgia) şi d = – , (în studiul din Marea Britanie) Cititorii neutri ar putea concluziona că medicamentul este unul ineficient, deoarece media celor trei studii este Însă această concluzie ar fi valabilă doar pentru belgieni, deoarece în SUA medicamentul a funcţionat, iar în Marea Britanie a avut efecte adverse, contrar celor aşteptate De aceea, mai important decât media în sine este să vedem care e nivelul de omogenitate/eterogenitate al efectului de-a lungul studiilor şi să găsim care sunt acele variabile moderatoare responsabile pentru variaţiile observate în mărimea efectului Capitolul Raportarea rezultatelor în articole de specialitate Calitatea unei cercetări poate fi subminată sau întărită de capacitatea autorilor de a aşterne în scris rezultatele cercetărilor lor Forma consacrată de comunicare a acestor rezultate este cea a articolelor de specialitate, supuse procesului de evaluare colegială (peer-review papers) Dacă articolul este coerent şi bine structurat, le va fi mai uşor atât evaluatorilor, cât şi publicului cititor să înţeleagă aspectele importante ale studiului, crescând şansele publicării, respectiv şansele ca articolul să aibă un impact mai ridicat printre specialişti Mai mult, capacitatea autorilor de a scrie oferă adesea indicii cu privire la maturitatea lor, cazurile de articole scrise foarte clar fiind mult mai frecvente printre cercetătorii cu experienţă decât printre cercetătorii tineri Ţinând cont de aceste considerente, în acest capitol vom prezenta o serie de recomandări privind structurarea unui articol de specialitate, dar şi privind procesul editorial asociat acestui demers La fel ca în cazul celorlalte capitole, accentul va fi pus de aspectele aplicative, pragmatice, pentru a-i ajuta pe cei interesaţi să valorizeze la maximum potenţialul cercetărilor realizate sau în curs de realizare Ne vom referi îndeosebi la articolele empirice (cele care presupun colectarea şi analiza unor date de către cercetători), dar vom face unele referiri şi la alte categorii de articole cum sunt cele din zona studiilor de sinteză: studiile metaanalitice şi sintezele narative (teoretice) O altă precizare necesară este aceea că ne vom focaliza asupra structurării articolelor adresate unui public-ţintă cunoscător (reviste cu nivel ridicat de specializare) şi mai puţin asupra publicării unor articole în reviste de popularizare Anatomia unui articol empiric Acest tip de studiu este, de departe, cel mai răspândit tip de articol ştiinţific, deoarece sub această formă sunt cuprinse toate studiile primare, bazate pe colectarea şi analiza datelor Datorită răspândirii acestui tip de studiu, structura articolelor empirice pare familiară atât specialiştilor, cât şi cititorilor aflaţi în perioada de formare profesională (studenţi, masteranzi), ea putând fi înţeleasă, într-o formă simplă, ca o structură în patru paşi: introducere („Care este problema investigată?”), metodologia cercetării („Cum a fost investigată problema?”), rezultate („Ce rezultate s-au găsit?”) şi discuţii („Ce implicaţii/relevanţă au aceste rezultate?”) (Hall, ) Totuşi, într-o formă extinsă am putea vorbi de opt sau chiar nouă secţiuni ale unui articol empiric în forma sa publicată (Cooper, ): titlu, nota autorului, rezumat (abstract), introducere, metodologia cercetării, rezultate, discuţii, bibliografie şi, eventual, anexe (materiale suplimentare disponibile online) Asupra fiecăruia dintre aceste aspecte ne vom opri în continuare, făcând o serie de recomandări specifice Titlul articolului Alegerea titlului pentru articolele din domeniul psihologiei ar trebui să ţină seama atât de recomandările din domeniu (de exemplu, APA recomandă ca titlul să nu depăşească cuvinte , fiind preferate formulările concise; APA, ), cât şi de principalele trei calităţi pe care ar trebui să le aibă un titlu Aceste calităţi sunt: a fi informativ (să nu inducă în eroare), a fi atractiv (să trezească interesul cititorilor) şi a include cuvinte-cheie (să crească şansele de identificare ulterioară a articolului de către cei care vor căuta articole pe tema respectivă în baze de date internaţionale (Moss, ) Din perspectiva formei titlului, în domeniul psihologiei sunt utilizate frecvent două tipuri de titluri: nominale şi compuse (Budgell, ) În categoria titlurilor nominale se regăsesc acele titluri formate dintr-o afirmaţie care conţine ideea principală a articolului Titlurile compuse sunt formate din două părţi Prima parte poate fi o întrebare, poate fi un artificiu retoric sau o descriere succintă a aspectelor-cheie din studiu, în timp ce în partea a doua sunt oferite precizări suplimentare cu privire la tipul studiului, la alte caracteristici metodologice esenţiale ale studiului este Caseta Exemple de titluri Exemple de titluri nominale Efectul terapiei familial-sistemice asupra adolescenţilor cu depresie majoră Relaţia dintre angajamentul organizaţional şi fluctuaţia de personal a cadrelor didactice Inteligenţa generală ca predictor al performanţei extra-rol la angajaţii din industria uşoară Impactul grădiniţei cu program prelungit asupra achiziţiilor educaţionale şi a stării de bine a preşcolarilor Exemple de titluri compuse Descriere succintă + detaliu metodologic Tipuri de personalitate în baza modelului Big Five: o analiză de cluster pe populaţia din România Efectul terapiei raţional-emotive în reducerea cogniţiilor iraţionale la delincvenţi: un studiu clinic controlat Relaţia dintre personalitate şi absenteismul de la locul de muncă: o metaanaliză Artificiu retoric + descriere succintă (+ detaliu metodologic) Noi credem în moderaţie: personalitate şi abilităţi de muncă în echipă Partea întunecată a predării: o metaanaliză a impactului comportamentelor didactogene ale profesorului asupra elevilor Întrebare + detaliu metodologic (alte aspecte) Sunt eficiente programele de training pentru părinţii copiilor cu ADHD? O metaanaliză Tutoriate online vs tutoriate faţă în faţă: care sunt mai eficiente? Un studiu longitudinal După cum se poate constata din caseta , titlurile nominale sunt cele mai succinte şi mai apropiate de esenţa problemei investigate, dacă ar fi să ne raportăm la modelul PI(C)O de formulare a problemei de cercetat Pe de altă parte, asemenea formulări tind să atragă mai puţin atenţia (cel puţin comparativ cu formulările retorice) şi să fie mai puţin utile pentru cercetătorii interesaţi să distingă încă din titlu despre ce fel de studiu este vorba (de exemplu, o metaanaliză, un studiu randomizat, un studiu longitudinal etc ) Nota autorului Scopul acestei mini-secţiuni (author note) este de a prezenta autorii articolului şi eventualele circumstanţe speciale care ar trebui cunoscute de către publicul cititor Standardele APA ( ) recomandă standardizarea acestui proces, prin cuprinderea următoarelor informaţii: (a) numele autorului (autorilor) şi afilierea instituţională şi departamentală a acestora la momentul derulării studiului, respectiv în prezent (numai pentru autorii care şi-au modificat între timp afilierea instituţională); (b) mulţumiri aduse (pentru sprijinul financiar primit în derularea studiului – numărul grantului, instituţia finanţatoare etc – respectiv pentru contribuţia adusă la reuşita studiului de către persoane care nu sunt incluse în lista de autori); (c) alte precizări explicite necesare în cazuri speciale (precizarea situaţiilor în care există un conflict de interese; menţionarea eventualelor studii publicate anterior care se bazează pe acelaşi eşantion sau aceeaşi bază de date; specificarea faptului că ordinea autorilor nu reflectă contribuţia lor la articol, toţi având contribuţii egale etc ); (d) date ale persoanei de contact Caseta Exemplu de notă a autorului Adaptare după Sava, Yates, Lupu, Szentagotai şi David ( ) Florin A Sava, Departamentul de Psihologie Clinică şi Psihoterapie, Universitatea „Babeş-Bolyai” din Cluj-Napoca; Brian T Yates, Departamentul de Psihologie, American University, Washington DC; Viorel Lupu, Departamentul de Fiziologie, UMF „Iuliu Haţeganu” din Cluj-Napoca; Aurora Szentagotai, Departamentul de Psihologie, Universitatea „Babeş-Bolyai” din Cluj-Napoca; Daniel David, Departamentul de Psihologie Clinică şi Psihoterapie, Universitatea „Babeş-Bolyai” din Cluj-Napoca Florin A Sava este afiliat în prezent la Departamentul de Psihologie, Universitatea de Vest din Timişoara Mulţumiri: această cercetare a fost susţinută de Institutul Albert Ellis, de CNCS şi de Centrul Român de Psihoterapie Cognitiv-Comportamentală, prin granturile , , respectiv ) Aceasta publicaţie se bazează pe aceeaşi bază de date utilizată în articolul menţionat mai jos Dacă în articolul respectiv s-a urmărit exclusiv compararea eficienţei celor trei intervenţii în combaterea depresiei majore, acest articol abordează comparativ raporturile cost-eficienţă şi cost-utilitate pentru cele trei intervenţii David, D , Szentagotai, A , Lupu, V , & Cosman, D ( ) „Rational emotive behavior therapy, cognitive therapy, and medication in the treatment of major depressive disorder: A randomized clinical trial, posttreatment outcomes, and six-month follow-up”, Journal of Clinical Psychology, , - Date de contact: corespondenţa pentru acest articol ar trebui trimisă către Florin A Sava, Departamentul de Psihologie, Universitatea de Vest din Timişoara, Bd Vasile Pârvan nr , , Timişoara, România, e-mail: afsava@socio uvt ro Pentru autorii care şi-au schimbat afilierea din momentul realizării studiului până în momentul publicării acestuia, cutuma este să se treacă ca afiliere instituţia de care autorul aparţine în momentul realizării studiului Rezumatul articolului şi cuvintele-cheie Modul de redactare a rezumatului unui articol este dependent, într-o anumită măsură, de recomandările revistei în care se intenţionează a fi publicat articolul, fiind întâlnite formate mai scurte (până la de cuvinte) sau mai lungi (până la - de cuvinte) Primele sunt scrise, de regulă, sub forma unui singur paragraf (rezumate narative), celelalte sub formă structurată în câteva mici secţiuni (rezumate structurate) (Budgell, ) În caseta este prezentat câte un exemplu pentru fiecare dintre cele două tipuri de rezumate, precum şi un exemplu de rezumat pentru cazul articolelor cu studii multiple Indiferent de formatul de redactare, formatul JARS recomandă includerea în rezumat doar a datelor de tip factual (fără aprecieri sau judecăţi de valoare), care să facă referire la: (a) problema investigată (background şi/sau obiectivul studiului); (b) detalii despre participanţi; (c) detalii-cheie despre metodologia studiului; (d) rezultate; (e) concluzii/implicaţii/aplicaţii Desigur, acest gen de raportare este funcţional îndeosebi atunci când articolul respectiv raportează un singur studiu Pentru articolele care conţin mai multe studii, nivelul de abstractizare creşte Caseta Exemple de rezumate Adaptare după Sava, Maricuţoiu, Rusu, Macsinga şi Vîrgă ( ) – de cuvinte Relaţia dintre credinţele iraţionale şi evaluările explicite, respectiv implicite ale stimei de sine a fost investigată în două studii corelaţionale independente (N = ; N = ), efectuate pe studenţi de la nivelul ciclului de licenţă În ambele studii cogniţiile iraţionale şi stima de sine explicită au fost evaluate prin GABS-SV, respectiv scala Rosenberg, în timp ce stima de sine implicită a fost evaluată în primul studiu prin testul asocierilor implicite (IAT), iar în al doilea studiu prin proba iniţialelor numelui Două rezultate robuste (replicate) indică existenţa unei corelaţii negative între stima de sine explicită şi autoblamare, o credinţă iraţională specifică, precum şi absenţa unei corelaţii între nivelul stimei de sine implicite şi oricare dintre credinţele iraţionale Aceste rezultate sugerează ideea că disputarea cogniţiilor iraţionale în cadrul intervenţiilor psihoterapeutice afectează doar cogniţiile explicite, cele implicite rămânând nealterate Adaptare după Sava, Yates, Lupu, Szentagotai şi David ( ) – de cuvinte Obiectiv Studiul compară raportul cost-eficienţă în cazul utilizării terapiei cognitiv-comportamentale (TCC), respectiv al fluoxetinei (Prozac) pentru tratamentul depresiei majore într-un studiu clinic controlat Participanţi şi design adolescenţi români nepsihotici, aflaţi la primul episod diagnosticat de depresie majoră, au fost distribuiţi randomizat în două grupe: TCC (N = ) şi fluoxetină (N = ) Ambele intervenţii s-au derulat săptămânal, timp de săptămâni Variabilele dependente principale Nivelul depresiei a fost evaluat în trei momente diferite (pretest, posttest şi follow-up la şase luni distanţă) prin scala de depresie Beck Rezultate Ambele forme de intervenţie reduc semnificativ statistic nivelul depresiei, raportându-ne la nivelul existent la pretest Nu există diferenţe semnificative între TCC şi fluoxetină cu privire la eficienţa lor în combaterea depresiei majore (d Cohen = , [– , ; , ] la nivel de posttest, respectiv , [– , ; , ] la nivel de follow-up) În schimb, TCC a obţinut un raport cost-eficienţă mai bun decât fluoxetina, datorită costurilor mai scăzute: mediana , USD/zi fără depresie pentru TCC, respectiv , USD/zi fără depresie pentru fluoxetină Implicaţii Rezultatul raportului cost-eficienţă este dependent de contextul economic, costul serviciilor de psihoterapie fiind mai scăzut decât costul farmacoterapiei în ţări cu economii emergente Din perspectiva utilităţii unui rezumat, acesta îndeplineşte două funcţii majore: (a) să prezinte clar, într-o manieră concisă, ideea şi rezultatele unui studiu, fiind primul şi, de multe ori, singurul paragraf citit dintr-o cercetare (aspect ilustrat în caseta ); (b) să crească şansele ca articolul să fie citat, prin facilitarea regăsirii acestuia în baze de date internaţionale Cu privire la cea de-a doua perspectivă, voi prezenta două recomandări utile: — sunt preferabile formulările cu un nivel redus de abstractizare; de exemplu, în loc să se spună că este vorba de participanţi, este preferabil să spunem că este vorba de adolescenţi din România; acest lucru va ajuta la identificarea articolului în baze de date internaţionale (de exemplu, cineva interesat să identifice eficienţa diferitelor forme de terapie pentru adolescenţi va introduce, foarte probabil, între cuvintele-cheie în limba engleză termeni precum teenagers sau adolescents; dacă în rezumat vom trece cuvântul participanţi şi dacă titlul nu conţine referiri exacte la populaţia-ţintă, articolul nostru nu va fi selectat pe baza celor două cuvinte specificate; reversul nu este însă valabil deoarece dacă cineva este interesat de nivelul eficienţei terapiei la nivel global, e puţin probabil să introducă termeni generici, precum participants, preferând să se focalizeze pe alte cuvinte-cheie; aceeaşi recomandare de a utiliza termeni categoriali cât mai concreţi este valabilă şi pentru alte aspecte, precum tipul de studiu sau instrumentele utilizate; de exemplu, ar fi dezirabil să se facă referire la tipul de studiu, astfel încît în locul unor exprimări de genul in this study ar fi mai bine să fie precizat exact tipul studiului (in this correlational study; in this randomized trial) pentru a uşura munca de selectare a studiilor relevante atunci când alţi autori sunt interesaţi de o anumită tipologie de studii; — dacă rezumatele sunt generoase ca număr de cuvinte permise, este recomandabil să fie prezentate explicit rezultatele obţinute astfel încât să poată fi valorificate rezultatele articolului în metaanalize (vezi al doilea exemplu din caseta ); acest lucru este util deoarece multe baze de date indexează doar rezumatul articolelor, dar chiar şi pentru articolele indexate integral există multe situaţii în care accesul la acestea se face doar în regim contra cost Desigur, formatele pentru rezumat prezentate anterior se referă la cazul studiilor empirice Pentru alte tipuri de studii, cum sunt evaluările sistematice, este preferabil un model structurat cu şase puncte (Budgell, ) – obiectiv, sursa datelor, selecţia studiilor, metode de extragere a datelor, rezultate sintetice şi concluzii –, precum cel prezentat în caseta Detalii despre alte tipuri de studii (metodologice, teoretice, studii de caz etc ) se găsesc în manualul oficial al standardelor de publicare APA ( ) Caseta Exemplu de rezumat pentru o metaanaliză Adaptare după Szentagotai şi David ( ) – cuvinte Obiectiv Scopul studiului este de a realiza o metaanaliză cu referire la efectul terapiei cognitiv-comportamentale (TCC) ca tratament adjuvant la medicaţie în cazul pacienţilor diagnosticaţi cu depresie bipolară Sursa datelor Au fost incluse articolele publicate în perioada - , selectate din baza de date Medline Cuvintele-cheie utilizate au fost: cognitiv şi tulburare bipolară, terapie cognitivă şi tulburare bipolară, terapie cognitiv-comportamentală şi tulburare bipolară Selecţia studiilor Criteriile de includere se referă la: (a) studii clinice controlate în care una dintre intervenţii este TCC; (b) existenţa unui grup de control care primeşte doar medicaţie; (c) existenţa datelor suficiente pentru calculul mărimii efectului Metode de extragere Indicatorul d Cohen a fost utilizat pentru calcularea mărimii efectelor, acestea fiind reunite apelând la modelul metaanalizei efectelor aleatorii Rezultate A fost obţinut un efect scăzut spre moderat al impactului adjuvant al TCC la nivel de posttest (d = , , p , în baza unei testări iniţiale) Lotul de participanţi a fost selectat dintr-un eşantion iniţial format din de studenţi supuşi unei evaluări psihologice Criteriile de eligibilitate pentru studiu au fost următoarele: (a) participanţii să se afle la prima lor experienţă de evaluare printr-o măsură de tip implicit; (b) să nu aibă în istoricul personal vreo suferinţă care să fi necesitat intervenţie psihiatrică; (c) să nu prezinte vreo tulburare de personalitate din axa II a DSM-IV, în baza evaluării psihologice realizate De asemenea, pentru a fi incluşi în analiză participanţii trebuiau să completeze sarcina SMP de evaluare a conştiinciozităţii la nivel implicit, conform instructajului, fiind excluşi cei care au completat superficial sarcina (care au avut la mai mult de % din cazuri un timp de reacţie pentru răspuns sub ms)  Caracteristicile participanţilor Aici sunt prezentate informaţii utile despre caracteristicile participanţilor incluşi în studiu: de tip demografic (vârstă, sex, status [lot clinic vs lot neclinic]) sau variabile relevante pentru problema studiată (dacă este cazul) Astfel, în final au fost analizate rezultatele provenite de la de participanţi ( %) Cinci studenţi au fost excluşi din analiză pentru că nu îndeplineau criteriile de eligibilitate, iar alţi pentru nerespectarea instructajului Caracteristicile demografice pentru cei de participanţi incluşi în analiză indică o proporţie mai ridicată de studenţi de sex feminin ( %) şi vârste cuprinse între şi de ani (M = , ; SD = , )  Descrierea procedurii de eşantionare Se precizează ce fel de procedură a fost utilizată pentru constituirea eşantionului de participanţi Procedura de recrutare a studenţilor a fost una de tip neprobabilistic, bazată pe convenienţă, în baza unui anunţ postat electronic pe site-ul universităţii  Precizări referitoare la aspectele etice Se referă la consimţământul informat de a fi subiecţi ai cercetării şi la eventualele beneficii oferite Participanţii eligibili pentru acest studiu au semnat un formular de consimţire informată a participării lor la studiu şi au fost recompensaţi cu un punctaj pentru efortul lor voluntar  Alte precizări tehnice O ultimă componentă de inclus cu ocazia descrierii participanţilor face referire la puterea statistică a studiului Tot aici trebuie precizat dacă există alte publicaţii pornind de la eşantionul studiat (dacă este cazul) Deoarece este prima dată când se încearcă utilizarea sarcinii SMP pentru a măsura implicit nivelul conştiinciozităţii, se observă că cei de participanţi analizaţi asigură o putere statistică de , pentru a surprinde asocieri de intensitate medie (moderată, r = , ), între această variabilă centrală şi măsura explicită a conştiinciozităţii/criteriile comportamentale incluse  Instrumente (măsurători) – Ilustrare selectivă   Fie că este vorba de teste psihologice, de sarcini creative, de măsurători fiziologice etc , sunt prezentate succesiv, pornind de la cele mai relevante, cum ar fi conceptul central al lucrării sau variabilele dependente principale (primary outcomes), şi finalizând cu cele cu o relevanţă mai scăzută În cazul testelor, modelul clasic de redactare implică o trimitere bibliografică către instrumentul utilizat, scurte detalii legate de interpretare şi referiri succinte la caracteristicile psihometrice Totuşi, dacă probele sunt mai puţin cunoscute, acest ultim aspect poate fi dezvoltat în cadrul unui paragraf întreg În cazul utilizării unor aparaturi sau în situaţia apelării la unele sarcini de laborator, acestea sunt descrise în detaliu, dacă nu există vreo referinţă bibliografică ce conţine aceste detalii Sarcina SMP a fost utilizată pentru a surprinde nivelul implicit al conştiinciozităţii (C SMP) Pentru a implementa C SMP am apelat la aplicaţia software Direct RT v (Empirisoft, ) Sarcina implică prezentarea succesivă pe ecranul calculatorului a de perechi de stimuli (amorsă + ţintă) Stimulii-amorsă fac referire la descriptori adjectivali specifici unui nivel ridicat al conştiinciozităţii (de exemplu, sârguincios), şi la descriptori adjectivali relevanţi pentru un nivel scăzut al conştiinciozităţii (de exemplu, leneş) Aceştia au fost selectaţi dintre descriptorii adjectivali recunoscuţi ca specifici pentru cei doi poli ai C (Schmuckle şi Egloff, ) Stimulii-ţintă constau într-o serie de pictograme chinezeşti, neutre din punct de vedere semantic (datorită opacităţii lor) şi afectiv În acest sens, toate pictogramele chinezeşti au fost evaluate ca fiind neutre afectiv într-un pretest în care li se cerea participanţilor să evalueze pe o scală de la (neplăcut) la (plăcut) valenţa fiecărei pictograme în parte (N = , M = , , SD = , )   De asemenea, sunt foarte utile precizările suplimentare cu privire la calitatea datelor colectate, îndeosebi pentru sarcini mai puţin standardizate sau pentru cele construite ad-hoc Ne referim aici, fără a ne rezuma doar la acestea, la aspecte precum: dovezi din pretestare cu referire la anumite proprietăţi ale instrumentelor; la experienţa celor care implementează intervenţiile psihoterapeutice; performanţa în evaluarea/codarea observaţiilor în baza unor grile; verificarea reuşitei manipulării experimentale Cele de amorse au fost prezentate într-o ordine aleatorie, fiind împerecheate, tot aleatoriu, cu stimulii-ţintă În fiecare dintre cele de secvenţe, stimulul-amorsă a fost prezentat în centrul ecranului, cu caractere Arial , pentru o perioadă de ms Stimulul era apoi înlocuit cu un dreptunghi alb ( × cm) timp de ms, totalizând un SOA de ms După dispariţia dreptunghiului alb, apare stimulul-ţintă timp de ms, cu dimensiunea pictogramei de × cm Apoi pictograma este înlocuită de un dreptunghi de culoare gri de aceleaşi dimensiuni, care rămâne pe ecran până la înregistrarea răspunsului Aspectul inovativ implicat de SMP este faptul că li se cere participanţilor să evalueze pentru fiecare pictogramă în parte dacă aceasta ar fi potrivită să fie imprimată pe un tricou personalizat sau nu În evaluarea dacă pictograma i se potriveşte sau nu, i se atrage atenţia celui testat să nu se lase influenţat în decizia sa de semnificaţia stimulului-amorsă care precedă fiecare pictogramă evaluată Pentru a cota C SMP s-a acordat câte un punct pentru fiecare pictogramă aleasă ca fiind potrivită, dacă aceasta era precedată de un stimul-amorsă din zona polului ridicat al C, respectiv pentru fiecare pictogramă respinsă (nepotrivită), dacă aceasta era precedată de un stimul-amorsă din zona polului scăzut al C Astfel, scoruri ridicate sunt indicative pentru un nivel crescut al conştiinciozităţii măsurate implicit Consistenţa internă măsurată în acest caz prin metoda înjumătăţirii indică o valoare acceptabilă pentru C implicit, de , ) Scala C din proba NEO-FFI (Costa şi McRae, ) a fost utilizată pentru surprinderea nivelului explicit al conştiinciozităţii Scala C conţine itemi în format Lickert cu trepte, scorul total fiind obţinut prin însumarea celor itemi Scoruri ridicate la scala C din NEO-FFI indică un nivel crescut al C explicite, consistenţa internă pentru acest studiu fiind de ,  Procedură  Aspecte ce ţin de colectarea datelor Sunt oferite informaţii cu privire la contextul cercetării (locaţie, contextul testării, succesiunea probelor), iar uneori detalii suplimentare (cum ar fi instructajul verbatim) pentru măsurători esenţiale sau o referinţă bibliografică pentru acestea Participanţii au fost testaţi în varianta creion-hârtie, în grupuri de - persoane, în cazul măsurilor explicite, respectiv individual, la calculator, într-o cameră izolată fonic, în cazul C SMP Ordinea de prezentare a instrumentelor a fost: mai întâi C SMP, apoi setul de probe explicite (acestea din urmă fiind contrabalansate ca ordine de prezentare)  Aspecte ce ţin de analiza datelor Se referă la managementul datelor colectate (date care lipsesc, prelucrări preliminare ale lor etc ) Pentru a analiza sintetic relaţia dintre C SMP, respectiv C NEO-FFI, cu indicatorii comportamentali, aceştia au fost regrupaţi prin metoda componentelor principale într-un singur scor global  Dintr-o perspectivă sintetică, această secţiune metodologică ar trebui să ne ajute să vedem esenţa calităţii studiului, cel puţin cu privire la: (a) „Pe ce populaţie a fost făcut studiul şi în ce măsură rezultatele pot fi generalizate în alte contexte?” (validitate externă); (b) „Ce fel de măsurători au fost efectuate şi ce încredere avem în aceste măsurători, respectiv în procedurile de colectare a lor?” (validitate de construct); (c) „În ce măsură designul ales şi variabilele incluse sunt potrivite pentru a răspunde adecvat la obiectivul studiului?” (validitate internă); (d) „În ce măsură informaţiile prezentate în această secţiune sunt suficient de detaliate pentru a permite replicarea studiului (validitate externă) şi pentru a aprecia ca reduse riscurile obţinerii unor rezultate distorsionate, ca urmare a unor deficienţe în implementarea studiului şi/sau a necontrolării unor variabile străine (validitate internă) sau a unui număr insuficient de participanţi (validitate statistică)?” Dată fiind importanţa deosebită a acestor întrebări, este de la sine înţeles că modelul prezentat în tabelul este un model minimal, util mai degrabă pentru a descrie studii non-experimentale de tip corelaţional Aceste specificaţii trebuie adaptate în funcţie de caracteristicile fiecărui tip de studiu în conformitate cu prevederilor specificate în standardele asociate acestora (vezi tabelul ) Rezultate A treia secţiune majoră dintr-un articol empiric este aceea în care sunt prezentate rezultatele La fel ca în cazul secţiunii de metodologie a cercetării, structura secţiunii de rezultate variază mult în funcţie de tipul de studiu derulat şi de problematica investigată (obiectivul urmărit) De aceea, se recomandă utilizarea aceloraşi standarde specifice specificate în tabelul pentru a redacta acurat această parte din articol În cele ce urmează vom prezenta câteva sugestii generale cu privire la redactarea acestei secţiuni, dar şi unele aspecte punctuale care ar trebui să se regăsească în secţiunea de rezultate Menţiuni generale pentru secţiunea de rezultate (Priebe, ; Thompson, ): — de regulă, secţiunea de rezultate conţine: (a) paragrafe de text în care se expune semnificaţia datelor prezentate, însoţită de dovezi statistice (tehnice) care să o susţină (de exemplu, se constată un nivel mai scăzut al anxietăţii sociale la participanţii care au urmat terapie cognitiv-comportamentală decât la cei din grupul de control – t( ) = , , p , ”) Din aceste tabele nu ar trebui să lipsească indicatorii descriptivi relevanţi precum numărul de participanţi, mediile şi abaterile standard De asemenea, în cazul studiilor de tip corelaţional supuse unor analize statistice multivariate (regresii, analize factoriale etc ) ar trebui să fie prezentată şi matricea de corelaţii dintre variabile În cazul în care nu există trimiteri la tabele/figuri, afirmaţiile din text ar trebui susţinute de rezultatele statistice efective (de exemplu, C SMP corelează pozitiv cu indicatorul global C explicit: r( ) = , , p < , ) Din motive de fluenţă a textului se preferă însă păstrarea unui text curat, lipsit de elementele tehnice care să îngreuneze citirea şi înţelegerea În schimb, tabelele (figurile) ar trebui să conţină informaţiile tehnice (dovezile) care susţin aceste afirmaţii Secţiunea de discuţii conţine adesea referiri la patru dintre cei şase factori identificaţi ca determinanţi în aprecierea calităţii unui articol (Sternberg şi Gordeeva, ) Cei patru factori sunt importanţa teoretică, valoarea pentru studiile viitoare, acurateţea metodologică şi importanţa practică a rezultatelor La aceştia se adaugă doi factori mai generali: actualitatea temei şi calitatea prezentării (adică respectarea recomandărilor precizate în tabelele - ) După cum se poate sesiza pe parcursul întregii cărţi, există o diferenţă între standardele de redactare a bibliografiei conform APA, ediţia a VI-a (APA, ), exemplificate în tabelul , şi standardele adoptate de Editura Polirom pentru colecţiile sale Dacă articolul nu are alocat un DOI (digital object identifier, specificat, de obicei, pe prima pagină a unui articol disponibil online) se trece sintagma „Găsit la” (Retrieved from), urmată de adresa electronică a revistei Dacă revista nu are pagină web (reviste care şi-au încetat apariţia), dar articolul este identificat tot în mediul online, atunci se specifică, în locul adresei web a revistei, adresa web a bazei de date unde a fost găsit (de exemplu, www eric com) În sfârşit, dacă articolul există doar în format tipărit, referinţa bibliografică se încheie după precizarea numerelor de pagină, fără a mai fi specificat vreun DOI sau vreo adresă de web Alte două programe, cu funcţii similare, întâlnite frecvent sunt EndNote şi Reference Manager, însă acestea sunt disponibile contra cost sau sunt dependente de accesul la baza de date ISI Web of Science În domeniul medical, criteriile grupului Vancouver pentru autorat sunt mult mai dure, solicitând autorilor să îndeplinească concomitent toate cele trei criterii: contribuţie substanţială în conceperea designului şi studiului sau în analiza ori interpretarea datelor; contribuţie substanţială în scrierea sau revizuirea articolului; acordul cu privire la versiunea finală a studiului (vezi Horton, , sau Parmley, ) Simmons et al ( ) evidenţiază variaţii în decizia de eliminare a unor participanţi din studii experimentale bazate pe timpi de reacţie (TR), sub motivul că un timp de reacţie prea scurt semnifică o procesare superficială/răspunsuri întâmplătoare Acest timp prea scurt poate varia în funcţie de interesele cercetătorului: de la praguri absolute de genul ms, ms sau ms, la exprimări relative în termeni de „x” abateri standard peste medie, unde x poate varia de la un studiu la altul, în funcţie de decizia cercetătorului Au fost dezvoltate o mulţime de aplicaţii informatice (de exemplu, puteţi căuta pe internet plagiarism software), multe dintre acestea fiind disponibile gratuit Dezavantajul lor este că pot detecta doar pasaje comune scrise în aceeaşi limbă (de exemplu, un articol scris în engleză din surse scrise în aceeaşi limbă), fiind irelevante pentru fraude de tipul unor traduceri extinse (cuvânt cu cuvânt) din engleză în română sau viceversa Această problemă apare de obicei în domeniul artistic şi în domeniul media, în care creaţii anterioare sunt utilizate pentru a produce efecte/lucrări noi (de exemplu, o Mona Lisa cu mustaţă) Transpunerea acestui principiu în domeniul psihologiei ar însemna permisiunea de a utiliza porţiuni de text scrise anterior în lucrările noi ale aceluiaşi autor sau al altor autori dacă acest fapt are un rol inovator/vizează scopuri diferite De exemplu, porţiuni dintr-un articol care abordează problematica cost-eficienţă a unei intervenţii psihoterapeutice pot fi reproduse într-un manual introductiv de metodologia analizelor de tip economic în psihoterapie pentru a ilustra modul de realizare a unei astfel de analize, dacă se respectă regulile de citare, respectiv drepturile de autor Vezi acuzaţiile de plagiat aduse persoanelor din conducerea unei universităţi din România, care apoi au încercat să se disculpe dând vina pe un alt coautor (un doctorand care a abuzat de încrederea lor, plagiind din lucrarea unui alt autor, fără ştiinţa acestora) O listă a revistelor cu acces liber, inclusiv din domeniul psihologiei ( de reviste) poate fi consultată în DOAJ (Directory of Open Access Journals – www doaj org) Cele mai multe reviste cu acces liber se autofinanţează prin perceperea unei taxe de publicare de la autorii articolelor acceptate În ciuda acestui dezavantaj evident, strategia este în continuă extindere datorită celorlalte avantaje majore: scurtarea duratei de publicare, respectiv o probabilitate mai ridicată de acceptare a articolului Până la urmă, editorul este cel care ia decizia de a publica sau respinge un manuscris El ia decizii în baza analizei făcute de către evaluatorii desemnaţi şi în baza propriilor reflecţii cu privire la articol De cele mai multe ori, aceste decizii converg, însă pot exista cazuri în care articolul este acceptat spre publicare în ciuda unor critici majore venite din partea unui evaluator sau situaţii de recomandări favorabile din partea evaluatorilor urmate de decizia editorului de a respinge articolul (însă asemenea situaţii sunt întâlnite doar în cazul revistelor de top, unde concurenţa acerbă împiedică publicarea unor articolele bune) 